Làm thế nào để nhập dữ liệu vào Python? – tải tệp vào python

Tìm hiểu cách nhập dữ liệu vào Python – sử dụng Pandas để nhập tập dữ liệu cố định từ tệp CSV hoặc Excel và tìm hiểu cách xử lý dữ liệu trực tiếp từ Yahoo Finance.

Bạn đang xem : tải tệp vào python

Tại sao nhập dữ liệu vào Python?

Một trong nhiều ứng dụng của khoa học dữ liệu là phân tích tài chính.

Và cũng giống như với bất kỳ phân tích định lượng nào khác, chúng tôi bắt đầu với dữ liệu . Chúng tôi có thể xử lý trước, thay đổi, tạo mẫu, lưu trữ hoặc xóa bỏ. Nhưng trước khi chúng tôi thực hiện bất kỳ điều gì trong số đó, chúng tôi cần nhập nó. Vì vậy, trong hướng dẫn này, tôi sẽ chỉ cho bạn cách nhập dữ liệu vào Python.

Chúng ta sẽ bắt đầu bằng cách tìm hiểu cách sử dụng Pandas và nhập tập dữ liệu cố định từ tệp CSV hoặc tệp Excel. Sau đó, chúng ta sẽ xem cách thu thập dữ liệu trực tiếp từ Yahoo Finance.

Đây là lý do tại sao điều đó lại quan trọng:

Dữ liệu có thể được lưu trữ theo nhiều cách khác nhau – chúng tôi có thể có một tệp nằm trên máy của chúng tôi hoặc một API đám mây. Mỗi định dạng duy nhất được nhập theo một cách hơi khác nhau, vì vậy chúng tôi phải có khả năng sử dụng bất kỳ dữ liệu nào được cung cấp.

Nghe có vẻ thú vị, phải không?

Hãy bắt đầu!

Làm cách nào để nhập dữ liệu vào Python?

Trước hết, để nhập dữ liệu vào Python, trước tiên chúng ta cần tải Python lên.

Tôi thích Jupyter hơn, nhưng bạn cũng có thể sử dụng bất kỳ môi trường nào khác. Tiếp theo, bạn cần nhập tất cả các gói có liên quan. Đây, đó là mô-đun “pandas”, vì vậy chúng tôi nhập “import pandas as pd”.

import-pandas-jupyter-python

Làm cách nào để tải dữ liệu vào Python từ tệp CSV?

Để nhập dữ liệu từ tệp CSV, chúng tôi sẽ tạo đối tượng “Khung dữ liệu” bằng mô-đun “gấu trúc”.

Chúng tôi đặt tên cho biến là “raw_csv_data” và sử dụng nó để ghi lại các giá trị từ hàm tích hợp “read_csv” từ gói “pandas”. Sau đó, bên trong dấu ngoặc đơn, trong dấu ngoặc kép, chúng ta thêm tên của tệp. Trong trường hợp của chúng tôi, đó là “Chỉ mục năm 2018” .

load-data-python-csv

Bây giờ, điều này rất quan trọng.

Đảm bảo rằng bạn lưu tệp trong cùng thư mục với mã Python của bạn. Nếu không, bạn sẽ phải chỉ định đường dẫn của thư mục chính xác nơi bạn đã lưu trữ nó. Nếu bạn cần làm điều đó, chỉ cần nhớ sử dụng dấu gạch chéo về phía trước khi đặt thư mục thích hợp, vì dấu gạch chéo ngược phục vụ một mục đích khác trong Python.

Đây là cách thực hiện:

load-data-python-csv-file

Khung dữ liệu “raw_csv_data” hiện chứa tất cả thông tin từ tệp CSV mà chúng tôi quan tâm.

Cách nhập dữ liệu vào Python từ tệp Excel?

Ngoài ra, nếu tập dữ liệu mà chúng tôi quan tâm được lưu trữ trong bảng tính Excel thì thay vào đó, chúng tôi có thể sử dụng phương pháp “read_excel” theo cùng một cách. load-data-python-excel

Nếu bạn muốn phân tích tài chính, bạn không muốn bỏ lỡ phần tiếp theo vì ở đó bạn sẽ học cách nhập dữ liệu sang Python trực tiếp từ Yahoo Finance.

Cách nhập dữ liệu vào Python từ Yahoo Finance?

Chúng tôi sẽ nhập dữ liệu vào Python bằng cách loại bỏ dữ liệu của Yahoo Finance bằng thư viện rất tiện lợi do Ran Aroussi tạo ra.

Chúng tôi sẽ sử dụng một gói hoàn toàn mới cho nhiệm vụ này, được gọi là “yfinance”. Tất nhiên, cái tên này đến từ Yahoo Finance, nơi chúng tôi đang lấy các giá trị từ đó.

Chỉ có một vấn đề.

Thư viện này không được cài đặt sẵn trong Anaconda, vì vậy chúng tôi cần phải cài đặt – cài đặt nó trước.

Xem Thêm  Department Press Briefing – January 31, 2022 - press any key to continue

Nếu bạn cần gợi ý về cách thực hiện điều đó, bạn có thể mở Anaconda Prompt và nhập “pip install yfinance”. pip-install-yfinance-python

Và khi đã sẵn sàng, bạn có thể sử dụng Jupyter để mở tệp Python Notebook được đính kèm với hướng dẫn này .

Bây giờ Hãy để tôi hướng dẫn bạn qua các bước còn lại.

Bắt đầu từ đầu, hãy nhanh chóng xem qua mã trước chúng tôi và xem lý do tại sao chúng tôi sử dụng mã đó.

Ô đầu tiên nhập rõ ràng gói có liên quan mà chúng tôi cần để tải dữ liệu. import-yfinance-yahoo

Ô thứ hai nhập một thư viện mới khác mà chúng tôi chưa từng thấy trước đây. Trên thực tế, mã này chỉ bỏ qua các cảnh báo mà Python có thể gửi trong trường hợp nó cho rằng bạn đang sử dụng dữ liệu không chính xác. Đừng lo lắng, chúng tôi chỉ thêm nó để đề phòng và sẽ không thực sự cần nó ở đây.

import-warning-yfinance-python

Tiếp theo, chúng tôi đang sử dụng phương pháp tải xuống để thu thập dữ liệu của chúng tôi từ trang web Yahoo Finance. Các nhận xét bên dưới thể hiện chức năng của mỗi đối số và cách sử dụng đối số đó đúng cách.

arg-python-Liberation

Hãy dành một chút thời gian để xem xét các nhận xét trong ô 3 của sổ ghi chép Python, trước khi chúng ta xem qua những gì chúng làm.

Lập luận “Tickers” có tác dụng gì?

Đối số “tickers” lấy tên của chuỗi thời gian mà chúng tôi muốn đưa vào. Tuy nhiên, tên của các chỉ mục không phải lúc nào cũng khớp với cách chúng được lưu trữ trong Yahoo Finance. Ví dụ: S & amp; P 500 không được biểu thị bằng SPX như chúng ta vẫn quen dùng, mà là “^ GSPC”.

Do đó, nếu bạn muốn tìm cách lưu trữ chỉ số thị trường hoặc cổ phiếu trong Yahoo Finance, chỉ cần truy cập trang web và sử dụng thanh tìm kiếm như hình dưới đây. Hình đại diện được in đậm ở bên trái cung cấp cho chúng tôi thông tin về cách chúng tôi lưu trữ những thông tin này và cách chúng tôi nhập chúng trong dấu ngoặc kép.

yfinance-tickers-argument-python

Các đối số “Bắt đầu” và “Kết thúc” làm gì?

Các đối số bắt đầu và kết thúc tự giải thích khá nhiều. Yếu tố quan trọng duy nhất ở đây là định dạng ngày tháng. Chúng tôi đang sử dụng định dạng YYYY / MM / DD, vì vậy hãy đảm bảo nhập ngày bắt đầu và ngày kết thúc chính xác nếu bạn muốn chuyển đổi chúng.

Lập luận “Khoảng thời gian” có tác dụng gì?

Đối số khoảng thời gian đặt tần suất của dữ liệu. Vì chúng tôi đang sử dụng giá trị hàng ngày, chúng tôi đặt giá trị đó bằng 1 ngày. khoảng-đối số-python-giá trị

Lập luận “Nhóm theo” có tác dụng gì?

Đối số group_by nhóm tất cả dữ liệu mà chúng tôi đang nhập dựa trên chuỗi thời gian (mã) mà nó thuộc về.

Còn về Cột “Điều chỉnh Tự động”?

Chà, cột auto_adjust chỉ đơn giản là thay thế giá đóng cửa bằng giá đóng cửa được điều chỉnh dựa trên phương pháp Mở-Cao-Đóng. Nếu chúng tôi để nó là “Sai”, là giá trị mặc định, chúng tôi sẽ có Giá đóng cửa và giá đóng cửa được điều chỉnh cho từng khoảng thời gian của từng chuỗi thời gian. Do đó, chúng tôi chỉ giới hạn dữ liệu thặng dư vì dù sao thì giá đóng cửa đã điều chỉnh cũng là giá chúng tôi sử dụng trong phân tích của mình.

Lập luận “Treads” hoạt động như thế nào?

Cuối cùng, đối số treads liên quan đến cách chúng tôi tải xuống dữ liệu khi chúng tôi xử lý một lượng lớn dữ liệu. Thông thường, để nó là True sẽ tốt hơn.

Làm cách nào để chúng ta tránh điều chỉnh lại dữ liệu khi bạn nhập dữ liệu vào Python?

Ở đây, chúng tôi chỉ đang tạo một bản sao của tập dữ liệu để chúng tôi không phải chỉnh sửa lại nếu chúng tôi vô tình xóa hoặc thay đổi các phần tử. create-back-up-copy-python

Xem Thêm  Định dạng ngày trong Python - ngày giờ định dạng python

Vì các ký hiệu như “^ GDAXI” hoặc “^ N225” có thể cực kỳ khó hiểu, chúng tôi quyết định thêm các cột mới vào khung dữ liệu của mình bằng các tên mà chúng tôi quen thuộc từ tập dữ liệu ban đầu của mình. Tất nhiên, như đã nói trước đây, chúng tôi chỉ sử dụng giá đóng cửa, vì vậy chúng tôi chỉ cần thuộc tính “Đóng” của từng chuỗi thời gian.

close-properties-python

Điều chúng tôi làm tiếp theo là xóa các phần tử đầu tiên của mỗi chuỗi thời gian vì cách thức mã hóa phương pháp tải xuống. Do thời gian đóng và mở khác nhau khi dữ liệu được lưu trữ, nên tập dữ liệu luôn bắt đầu 1 khoảng thời gian trước đối số “bắt đầu” mà chúng tôi đặt.

remove-first-Elements-remove-original-tickers-data-set-python

Sau khi xử lý xong, chúng tôi sẽ xóa dữ liệu dư thừa. Vì chúng tôi đã lưu trữ giá đóng cửa trong các cột mới mà chúng tôi tạo, chúng tôi có thể loại bỏ chuỗi video ban đầu mà chúng tôi đã loại bỏ khỏi trang web.

Tất nhiên, hai dòng cuối cùng của ô thứ 6 một lần nữa đặt tần suất và xử lý mọi giá trị bị thiếu.

Bây giờ, ô thứ 7 trong mã chỉ ở đó để xem chúng tôi đã thực hiện như thế nào cho đến nay. “Phương pháp head” giúp chúng tôi đảm bảo rằng các phần tử ban đầu của tập dữ liệu của chúng tôi giống với các phần tử từ tệp CSV. Ở đó có “phương pháp đuôi” để đảm bảo rằng chúng tôi đã đưa vào tất cả dữ liệu một cách chính xác cho đến khoảng thời gian mà chúng tôi quan tâm.

head-method-tail-method-python

Và lưu ý cuối cùng, hãy nhớ rằng trong thực tế, chúng tôi cũng cần xóa dữ liệu thừa và chia chúng thành tập huấn luyện và thử nghiệm.

Kết luận – Tài nguyên bổ sung

Giờ đây, bạn đã biết cách lấy bất kỳ dữ liệu nào bạn muốn từ Yahoo Finance và cách nhập dữ liệu đó vào Python, bạn có thể tìm hiểu và sử dụng bất kỳ dữ liệu nào bạn quan tâm mà không bị nhầm lẫn với dữ liệu chúng tôi cung cấp cho bạn. < / p>

Vì vậy, nếu bạn muốn tìm hiểu thêm về cách sử dụng gói mới này, bạn có thể tìm thêm chi tiết tại đây. https://pypi.org/project/yfinance/

***

Nếu bạn quan tâm đến việc nâng cao kiến ​​thức Python của mình, hãy hãy xem các hướng dẫn siêu thực tế của chúng tôi !

Sẵn sàng bắt đầu học Khoa học dữ liệu?

Hãy xem hoàn chỉnh Chương trình Khoa học Dữ liệu ngay hôm nay. Bắt đầu với các nguyên tắc cơ bản với các khóa học Thống kê, Toán học và Excel của chúng tôi. Xây dựng trải nghiệm từng bước với SQL, Python, R và Tableau. Và nâng cấp bộ kỹ năng của bạn với Học máy, Học sâu, Lập mô hình rủi ro tín dụng, Phân tích chuỗi thời gian và Phân tích khách hàng bằng Python. Nếu bạn vẫn không chắc chắn muốn biến mối quan tâm của mình đến khoa học dữ liệu thành một sự nghiệp vững chắc, chúng tôi cũng cung cấp phiên bản xem trước miễn phí của Chương trình Khoa học dữ liệu . Bạn sẽ nhận được miễn phí 12 giờ nội dung dành cho người mới bắt đầu đến nâng cao. Đó là một cách tuyệt vời để xem liệu chương trình có phù hợp với bạn hay không.


Xem thêm những thông tin liên quan đến chủ đề tải tệp vào python

[Khóa học lập trình Python cơ bản] – Bài 19: Xử lý File trong Python| HowKteam

alt

  • Tác giả: K team
  • Ngày đăng: 2017-12-05
  • Đánh giá: 4 ⭐ ( 7095 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: [Khóa học lập trình Python cơ bản] – Bài 19: Xử lý File trong Python| HowKteam

    Nếu các bạn thấy hay thì hãy đăng ký theo dõi kênh, like, share cho mọi người cùng tham gia nhé.

    Muốn ủng hộ mình các bạn có thể nhấn vào quảng cáo hiện lên và load xong để mình được ít tiền duy trì nhé.
    Cảm ơn mọi người.

    Học thêm kiến thức hoặc tải tài liệu tại https://www.howkteam.com/
    Luyện tập trắc nghiệm mỗi ngày tại https://kquiz.vn/

    Bài trước:
    [Khóa học lập trình Python cơ bản] – Bài 18: Dict trong python p2 | HowKteam
    https://www.youtube.com/watch?v=jmwBKuJl2Zg

    Bài sau:
    [Khóa học lập trình Python cơ bản] – Bài 20: Iteration trong Python| HowKteam
    https://www.youtube.com/watch?v=GSUwh958k_A&list=PL33lvabfss1xczCv2BA0SaNJHu_VXsFtg&index=20

    Tập hợp khóa học lập trình cơ bản đến nâng cao.
    Tham gia group để cập nhật thêm thông tin cũng như tham gia khóa học online miễn phí.

    Group FB: http://Group.howkteam.com
    Website: http://www.howkteam.com/

    Danh sách phát: https://goo.gl/0LIji0

    C++:
    Lập trình C++: https://goo.gl/8RCMte
    Bài toán kinh điển C++: https://goo.gl/7CszwZ

    C:
    Lập trình C: https://goo.gl/AhxyAI
    Lập trình C WinForms: https://goo.gl/dPbSm4
    Lập trình ASP.NET MVC: https://goo.gl/riqrzP

    Java:
    Lập trình Java: https://goo.gl/VoDbbs
    Lập trình Android: https://goo.gl/LyV3ZX

    Game:
    Lập trình Unity 3D: https://goo.gl/RcBi6c

    Office:
    Office Word 2016: https://goo.gl/GQUk5E
    Office Excel 2016: https://goo.gl/N3qdKs
    Office Power Point 2016: https://goo.gl/zegyVx

    Products:
    Game Caro C Winforms: https://goo.gl/bMuXEC
    Game Flappy Bird Unity 3D: https://goo.gl/K00l5y
    Game bắn Zombies Unity 3D: https://goo.gl/HUjWlt
    Game Doge Unity 3D: https://goo.gl/0pysFu
    App lập lịch C Winforms: https://goo.gl/xO0iX3
    App từ điển nói C Winforms: https://goo.gl/KgHNNn
    App quản lý quán Cafe C Winforms: https://goo.gl/FLZDDM
    App key logger C Winforms: https://goo.gl/qV93CV

    Stream:
    Kỹ thuật: https://goo.gl/tGtmwq
    Kinh nghiệm: https://goo.gl/VsQjkc

    Âm thanh:
    Two Step From Hell Colors Of Love
    http://fbl.me/TJB
    https://www.facebook.com/Thomas-Bergersen-147900228587129/
    https://www.facebook.com/fourformusic
    http://www.thomasbergersen.com/

    Python Python_Cơ_Bản Howkteam Python_Basic Tự_Học_Python Free_Education Share_To_Be_Better LapTrinhKteam Kteam

Python: Pandas DataFrame: Làm việc với dữ liệu một cách thú vị

  • Tác giả: v1study.com
  • Đánh giá: 4 ⭐ ( 7364 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Pandas DataFrame: Làm việc với dữ liệu một cách thú vị

[Tự học Python] Hướng dẫn tải, cài đặt và chạy chương trình Python

  • Tác giả: cafedev.vn
  • Đánh giá: 5 ⭐ ( 1599 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Trong bài này chúng ta sẽ bắt đầu tìm hiểu cách để tải, cài và chạy một chương trình python bằng console như thế nào. Bước đầu tiên chúng ta cần làm là:

Hướng dẫn tải xuống và cài đặt Python trên Windows

  • Tác giả: download.com.vn
  • Đánh giá: 5 ⭐ ( 6829 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Hướng dẫn tải xuống và cài đặt Python trên Windows, Hướng dẫn tải xuống và cài đặt Python cùng với PyCharm IDE, phần mềm và IDE hỗ trợ học ngôn ngữ lập trình Python.

Cách thực hiện: Tải xuống một tệp với Python

  • Tác giả: helpex.vn
  • Đánh giá: 3 ⭐ ( 4498 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Tải tập tin từ internet là điều mà hầu hết mọi lập trình viên sẽ phải làm vào một lúc nào đó. Python cung cấp một số cách để làm điều đó trong thư viện chuẩn của nó. Có lẽ cách phổ biến nhất…

Cách đọc tệp excel (xlsx) trong python

  • Tác giả: vi.softoban.com
  • Đánh giá: 3 ⭐ ( 2495 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: .Xlsx là phần mở rộng của tài liệu excel có thể lưu trữ một lượng lớn dữ liệu dưới dạng bảng và nhiều kiểu tính toán số học và logic có thể được thực hiện dễ dàng trong một bảng tính excel. Đôi khi yêu cầu đọc dữ liệu từ tài liệu excel bằng tập lệnh Python cho mục đích lập trình. Cách đọc tệp excel (xlsx) trong python được giải thích trong bài viết này.

Cách tải tệp lên Google Drive bằng tập lệnh Python?

  • Tác giả: vi.uwenku.com
  • Đánh giá: 4 ⭐ ( 7773 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Tôi cần phải sao lưu các loại tệp khác nhau sang GDrive (không chỉ các định dạng chuyển đổi sang GDocs) từ một số máy chủ Linux. Cách đơn giản nhất, thanh lịch nhất để làm điều đó bằng tập lệnh python

Xem thêm các bài viết khác thuộc chuyên mục: Kiến thức lập trình

Xem Thêm  Vòng lặp for range trong Python (for i in range python) - python cho tôi trong phạm vi