Hàm pandas read_csv () được sử dụng để đọc tệp CSV vào khung dữ liệu. Với nó, bạn cũng có thể tùy chỉnh cách bạn muốn đọc tệp.

Bạn đang xem : đọc csv trong python bằng cách sử dụng pandas

Định dạng CSV (Các giá trị được phân tách bằng dấu phẩy) khá phổ biến để lưu trữ dữ liệu. Một số lượng lớn các tập dữ liệu hiện diện dưới dạng tệp CSV có thể được sử dụng trực tiếp trong phần mềm bảng tính như Excel hoặc có thể được tải lên bằng các ngôn ngữ lập trình như R hoặc Python. Khung dữ liệu gấu trúc khá mạnh mẽ để xử lý dữ liệu dạng bảng hai chiều. Trong hướng dẫn này, chúng ta sẽ xem xét cách đọc tệp csv dưới dạng khung dữ liệu gấu trúc trong python.

Hàm pandas read_csv () được sử dụng để đọc tệp CSV vào khung dữ liệu. Nó đi kèm với một số thông số khác nhau để tùy chỉnh cách bạn muốn đọc tệp. Sau đây là cú pháp chung để tải tệp csv vào khung dữ liệu:

  nhập gấu trúc dưới dạng pd
df = pd.read_csv (path_to_file)  

Ở đây, path_to_file là đường dẫn đến tệp CSV bạn muốn tải. Nó có thể là bất kỳ đường dẫn chuỗi hợp lệ nào hoặc một URL (xem các ví dụ bên dưới). Nó trả về khung dữ liệu gấu trúc. Hãy xem xét một số trường hợp sử dụng khác nhau của hàm read_csv () thông qua các ví dụ –

Trước khi chúng tôi tiếp tục, hãy lấy một tệp CSV mẫu mà chúng tôi sẽ sử dụng trong suốt hướng dẫn này. Chúng tôi sẽ sử dụng tập dữ liệu Iris mà bạn có thể tải xuống từ Kaggle . Dưới đây là ảnh chụp nhanh về giao diện của nó khi mở trong excel:

Ảnh chụp nhanh tập dữ liệu mống mắt trong Excel

Để đọc tệp CSV được lưu trữ cục bộ trên máy của bạn, hãy chuyển đường dẫn đến tệp đó tới hàm read_csv () . Bạn có thể chuyển một đường dẫn tương đối, nghĩa là, đường dẫn liên quan đến thư mục làm việc hiện tại của bạn hoặc bạn có thể chuyển một đường dẫn tuyệt đối.

  # đọc csv bằng đường dẫn tương đối
nhập gấu trúc dưới dạng pd
df = pd.read_csv ('Iris.csv')
print (df.head ())  

Đầu ra:

  Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Loài
0 1 5,1 3,5 1,4 0,2 Iris-setosa
1 2 4,9 3,0 1,4 0,2 Iris-setosa
2 3 4,7 3,2 1,3 0,2 Iris-setosa
3 4 4,6 3,1 1,5 0,2 Iris-setosa
4 5 5,0 3,6 1,4 0,2 Iris-setosa  

Trong ví dụ trên, tệp CSV Iris.csv được tải từ vị trí của nó bằng đường dẫn tương đối. Ở đây, tệp hiện diện trong thư mục làm việc hiện tại. Bạn cũng có thể đọc tệp CSV từ đường dẫn tuyệt đối của nó. Xem ví dụ bên dưới:

  # đọc csv bằng đường dẫn tuyệt đối
nhập gấu trúc dưới dạng pd
df = pd.read_csv (r "C: \ Users \ piyush \ Downloads \ Iris.csv")
print (df.head ())  

Đầu ra:

  Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Loài
0 1 5,1 3,5 1,4 0,2 Iris-setosa
1 2 4,9 3,0 1,4 0,2 Iris-setosa
2 3 4,7 3,2 1,3 0,2 Iris-setosa
3 4 4,6 3,1 1,5 0,2 Iris-setosa
4 5 5,0 3,6 1,4 0,2 Iris-setosa  

Tại đây, cùng một tệp CSV được đọc từ đường dẫn tuyệt đối của nó.

Bạn cũng có thể đọc tệp CSV từ URL của nó. Chuyển URL tới hàm read_csv () và nó sẽ đọc tệp tương ứng vào khung dữ liệu. Tập dữ liệu Iris cũng có thể được tải xuống từ Kho lưu trữ Máy học UCI . Hãy sử dụng URL tải xuống tập dữ liệu của họ để đọc nó dưới dạng khung dữ liệu.

  nhập gấu trúc dưới dạng pd
df = pd.read_csv ("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data")
df.head ()  

Đầu ra:

  5,1 3,5 1,4 0,2 Iris-setosa
0 4,9 3,0 1,4 0,2 Iris-setosa
1 4,7 3,2 1,3 0,2 Iris-setosa
2 4,6 3,1 1,5 0,2 Iris-setosa
3 5,0 3,6 1,4 0,2 Iris-setosa
4 5,4 3,9 1,7 0,4 Iris-setosa  

Bạn có thể thấy rằng hàm read_csv () có thể đọc tập dữ liệu từ URL của nó. Điều thú vị là trong nguồn dữ liệu cụ thể này, chúng tôi không có tiêu đề. Hàm read_csv () suy ra tiêu đề theo mặc định và ở đây sử dụng hàng đầu tiên của tập dữ liệu làm tiêu đề.

Xem Thêm  SQL là gì? Tất cả những gì bạn cần biết về ngôn ngữ SQL đều nằm trong bài viết này

Trong ví dụ trên, bạn thấy rằng nếu tập dữ liệu không có tiêu đề, thì hàm read_csv () sẽ tự suy diễn và sử dụng hàng đầu tiên của tập dữ liệu làm tiêu đề. Bạn có thể thay đổi hành vi này thông qua tham số header , chuyển None nếu tập dữ liệu của bạn không có tiêu đề. Bạn cũng có thể chuyển một danh sách các số nguyên tùy chỉnh làm tiêu đề.

  nhập gấu trúc dưới dạng pd
df = pd.read_csv ("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data", header = Không có)
df.head ()  

Đầu ra:

  0 1 2 3 4
0 5,1 3,5 1,4 0,2 Iris-setosa
1 4,9 3,0 1,4 0,2 Iris-setosa
2 4,7 3,2 1,3 0,2 Iris-setosa
3 4,6 3,1 1,5 0,2 Iris-setosa
4 5,0 3,6 1,4 0,2 Iris-setosa  

Trong ví dụ trên, chúng tôi chuyển header = None vào hàm read_csv () vì tập dữ liệu không có tiêu đề.

Bạn có thể đặt tên cột tùy chỉnh cho khung dữ liệu của mình khi đọc tệp CSV bằng cách sử dụng hàm read_csv () . Chuyển tên cột tùy chỉnh của bạn dưới dạng danh sách cho thông số names .

  nhập gấu trúc dưới dạng pd
df = pd.read_csv ("https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data",
                 names = ['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm', 'Species'])
print (df.head ())  

Đầu ra:

  SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Loài
0 5,1 3,5 1,4 0,2 Iris-setosa
1 4,9 3,0 1,4 0,2 Iris-setosa
2 4,7 3,2 1,3 0,2 Iris-setosa
3 4,6 3,1 1,5 0,2 Iris-setosa
4 5,0 3,6 1,4 0,2 Iris-setosa  

Bạn cũng có thể sử dụng một cột làm nhãn hàng của khung dữ liệu. Chuyển tên cột cho tham số index_col . Quay lại Iris.csv mà chúng tôi đã tải xuống từ Kaggle. Ở đây, chúng tôi sử dụng các cột Id làm chỉ mục khung dữ liệu.

  # đọc csv với một cột dưới dạng chỉ mục
nhập gấu trúc dưới dạng pd
df = pd.read_csv ('Iris.csv', index_col = 'Id')
print (df.head ())  

Đầu ra:

  SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Loài
ID
1 5,1 3,5 1,4 0,2 Iris-setosa
2 4,9 3,0 1,4 0,2 Iris-setosa
3 4,7 3,2 1,3 0,2 Iris-setosa
4 4,6 3,1 1,5 0,2 Iris-setosa
5 5,0 3,6 1,4 0,2 Iris-setosa  

Trong ví dụ trên, bạn có thể thấy rằng cột Id được sử dụng làm chỉ mục hàng của khung dữ liệu df . Bạn cũng có thể chuyển nhiều cột dưới dạng danh sách cho tham số index_col để được sử dụng làm chỉ mục hàng.

Bạn cũng có thể chỉ định tập hợp con các cột để đọc từ tập dữ liệu. Chuyển tập hợp con các cột bạn muốn làm danh sách vào tham số usecols . Ví dụ: hãy đọc tất cả các cột từ Iris.csv ngoại trừ Id .

  # đọc csv với một cột dưới dạng chỉ mục
nhập gấu trúc dưới dạng pd
df = pd.read_csv ('Iris.csv', usecols = ['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm', 'Species'])
print (df.head ())  

Đầu ra:

 SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Loài
0 5,1 3,5 1,4 0,2 Iris-setosa
1 4,9 3,0 1,4 0,2 Iris-setosa
2 4,7 3,2 1,3 0,2 Iris-setosa
3 4,6 3,1 1,5 0,2 Iris-setosa
4 5,0 3,6 1,4 0,2 Iris-setosa
 

Trong ví dụ trên, khung dữ liệu trả về không có cột Id .

Bạn cũng có thể chỉ định số hàng của tệp để đọc bằng cách sử dụng tham số nrows cho hàm read_csv () . Đặc biệt hữu ích khi bạn muốn đọc một phân đoạn nhỏ của tệp lớn.

  # đọc csv với một cột dưới dạng chỉ mục
nhập gấu trúc dưới dạng pd
df = pd.read_csv ('Iris.csv', nrows = 3)
print (df.head ())  

Đầu ra:

  Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Loài
0 1 5,1 3,5 1,4 0,2 Iris-setosa
1 2 4,9 3,0 1,4 0,2 Iris-setosa
2 3 4,7 3,2 1,3 0,2 Iris-setosa  

Trong ví dụ trên, chúng tôi chỉ đọc ba hàng đầu tiên của tệp Iris.csv .

Đây chỉ là một số điều bạn có thể làm khi đọc tệp CSV sang khung dữ liệu. Khung dữ liệu Pandas cũng cung cấp một số tính năng hữu ích để thao tác dữ liệu khi khung dữ liệu đã được tạo.

Xem Thêm  Giao diện Java (Có ví dụ) - ví dụ về giao diện java

Với điều này, chúng ta sẽ đi đến phần cuối của hướng dẫn này. Các ví dụ mã và kết quả được trình bày trong hướng dẫn này đã được triển khai trong Jupyter Notebook với hạt nhân python (phiên bản 3.8.3) có gấu trúc phiên bản 1.0.5

Đăng ký nhận bản tin của chúng tôi để biết thêm thông tin hướng dẫn và hướng dẫn.
Chúng tôi không spam và bạn có thể chọn không tham gia bất kỳ lúc nào.

Tác giả

  • Piyush là một nhà khoa học dữ liệu đam mê sử dụng dữ liệu để hiểu mọi thứ tốt hơn và đưa ra quyết định sáng suốt. Trong quá khứ, anh ấy từng là Nhà khoa học dữ liệu cho ZS và có bằng kỹ sư của IIT Roorkee. Sở thích của anh ấy bao gồm xem cricket, đọc sách và làm việc trong các dự án phụ.


Xem thêm những thông tin liên quan đến chủ đề đọc csv trong python bằng gấu trúc

Python Pandas Tutorial 4: Read Write Excel CSV File

alt

  • Tác giả: codebasics
  • Ngày đăng: 2017-02-04
  • Đánh giá: 4 ⭐ ( 1557 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: This tutorial covers how to read/write excel and csv files in pandas. We will cover,
    1) Different options on cleaning up messy data while reading csv/excel files
    2) Use convertors to transform data read from excel file
    3) Export only portion of dataframe to excel file

    Topics that are covered in this Python Pandas Video:
    0:00 Introduction
    1:26 Read CSV file using read_csv() method
    2:39 Skip rows in dataframe using “skiprows”
    4:44 Import data from CSV file with “null header”
    6:28 Read limited data from CSV file
    7:19 Clean up messy data from file “not available” and “n.a.” replace with “na_values”
    9:01 Supply dictionary for replace with “na_values”
    11:40 Write dataframe into “csv” file with “to_csv() method”
    15:27 Read excel file using read_excel() method
    18:03 Converters argument in read_excel() method
    20:17 Write dataframe into “excel” file with “to_excel() method”
    22:56 Use ExcelWritter() class
    25:13 All properties for Read Write Excel CSV File

    Do you want to learn technology from me? Check https://codebasics.io/ for my affordable video courses.

    Very Simple Explanation Of Neural Network: https://www.youtube.com/watch?v=ER2It2mIagI

    Code (jupyter notebook link): https://github.com/codebasics/py/tree/master/pandas/4_read_write_to_excel

    Next Video:
    Python Pandas Tutorial 5: Handle Missing Data: fillna, dropna, interpolate: https://www.youtube.com/watch?v=EaGbS7eWSs0&list=PLeo1K3hjS3uuASpe-1LjfG5f14Bnozjwy&index=5

    Popular Playlist:
    Complete python course: https://www.youtube.com/playlist?list=PLeo1K3hjS3uv5U-Lmlnucd7gqF-3ehIh0

    Data science course: https://www.youtube.com/playlist?list=PLeo1K3hjS3us_ELKYSj_Fth2tIEkdKXvV

    Machine learning tutorials: https://www.youtube.com/playlist?list=PLeo1K3hjS3uvCeTYTeyfe0-rN5r8zn9rw

    Pandas tutorials: https://www.youtube.com/playlist?list=PLeo1K3hjS3uuASpe-1LjfG5f14Bnozjwy

    Git github tutorials: https://www.youtube.com/playlist?list=PLeo1K3hjS3usJuxZZUBdjAcilgfQHkRzW

    Matplotlib course: https://www.youtube.com/playlist?list=PLeo1K3hjS3uu4Lr8_kro2AqaO6CFYgKOl

    Data structures course: https://www.youtube.com/playlist?list=PLeo1K3hjS3uu_n_a__MI_KktGTLYopZ12

    Data Science Project – Real Estate Price Prediction: https://www.youtube.com/watch?v=rdfbcdP75KI&list=PLeo1K3hjS3uu7clOTtwsp94PcHbzqpAdg

    To download csv and code for all tutorials: go to https://github.com/codebasics/py, click on a green button to clone or download the entire repository and then go to relevant folder to get access to that specific file.

    🌎 My Website For Video Courses: https://codebasics.io/

    Need help building software or data analytics and AI solutions? My company https://www.atliq.com/ can help. Click on the Contact button on that website.

    Facebook: https://www.facebook.com/codebasicshub
    Twitter: https://twitter.com/codebasicshub

Python – Xử lý dữ liệu CSV

  • Tác giả: isolution.pro
  • Đánh giá: 4 ⭐ ( 5326 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Đọc dữ liệu từ CSV (các giá trị được phân tách bằng dấu phẩy) là điều cần thiết cơ bản trong Khoa học dữ liệu. Thông thường, chúng tôi lấy dữ liệu từ nhiều nguồn khác nhau có thể được xuất sang định dạng CSV để các hệ thống khác có thể sử dụng chúng. Thư viện Panadas cung cấp…

Làm cách nào để đọc tệp csv bằng Python?

  • Tác giả: presbyteryofstockton.org
  • Đánh giá: 4 ⭐ ( 2475 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Tải tệp CSV sang Python Pandas # Tải thư viện Pandas với bí danh ‘pd’ nhập gấu trúc dưới dạng pd. # Đọc dữ liệu từ tệp ‘filename.csv’ # (trong cùng thư mục mà quy trình python của bạn dựa trên) # Kiểm soát dấu phân cách, hàng, tên cột bằng read_csv (xem sau) data = pd. # Xem trước 5 dòng đầu tiên của dữ liệu đã tải.

Đọc file CSV trong Python

  • Tác giả: viettuts.vn
  • Đánh giá: 4 ⭐ ( 3056 lượt đánh giá )
  • Khớp với kết quả tìm kiếm:

Đọc một csv với mảng numpy bằng cách sử dụng gấu trúc

  • Tác giả: vi.rachaelraypictures.com
  • Đánh giá: 5 ⭐ ( 9062 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Tôi có một tệp csv với 3 cột cảm xúc, pixel, Sử dụng bao gồm 35000 hàng, ví dụ: 0,70 23 45 178 455, Đào tạo. Tôi đã sử dụng pandas.read_csv để đọc tệp csv dưới dạng pd.read_csv (tên tệp, dtype = {’emo …

Tệp CSV Python: Đọc và Viết

  • Tác giả: helpex.vn
  • Đánh giá: 5 ⭐ ( 7279 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Python có một thư viện lớn các mô-đun đi kèm với phân phối của nó. Mô-đun csv cung cấp cho lập trình viên Python khả năng phân tích các tệp CSV (Giá trị phân tách bằng dấu phẩy). Tệp CSV là…

Chi tiết bài học 24.Đọc và ghi tệp CSV trong Python bằng Mô-đun CSV & Pandas

  • Tác giả: vimentor.com
  • Đánh giá: 3 ⭐ ( 8315 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Vimentor chi tiết bài học Đọc và ghi tệp CSV trong Python bằng Mô-đun CSV & Pandas

Xem thêm các bài viết khác thuộc chuyên mục: Kiến thức lập trình

Xem Thêm  Lệnh MySQL: Danh sách đầy đủ với các ví dụ - như lệnh trong mysql

By ads_php