Đọc tệp CSV dưới dạng DataFrame gấu trúc bằng Python (Ví dụ) – đọc csv dưới dạng python khung dữ liệu

Cách tải tệp CSV dưới dạng gấu trúc DataFrame bằng Python – 5 ví dụ lập trình Python – Cú pháp Python có thể lặp lại

Bạn đang xem: đọc csv dưới dạng python khung dữ liệu

Đọc Tệp CSV dưới dạng gấu trúc DataFrame bằng Python (5 Ví dụ)

Trong bài viết này, tôi sẽ trình bày cách nhập tệp CSV dưới dạng DataFrame của gấu trúc trong ngôn ngữ lập trình Python .

Mục lục:

Hãy bắt tay ngay vào!

Dữ liệu Mẫu & amp; Thư viện

Trước tiên, chúng tôi phải nhập thư viện gấu trúc :

 

import

pandas

as

pd

# Nhập thư viện gấu trúc sang Python

nhập gấu trúc dưới dạng pd # Nhập thư viện gấu trúc sang Python

Tiếp theo, chúng ta sẽ phải tạo tệp CSV mẫu cho các ví dụ của hướng dẫn này. Đối với điều này, chúng tôi sẽ sử dụng DataFrame của gấu trúc bên dưới:

 data 

=

pd.

DataFrame

(

{

'x1' < / p>:

phạm vi

(

10

,

17

)

,

# Tạo DataFrame cho gấu trúc

'x2'

:

[

9

,

2

,

7

,

3

,

3

,

< p> 1

,

8

]

,

'x3'

:

[

'a'

,

'b'

,

'c'

,

'd'

,

'e'

,

'f'

,

'g'

]

, < / p>

'x4'

:

phạm vi

(

25

,

18

,

-

1

)

}

)

data = pd.DataFrame ({‘x1’: range (10, 17), # Tạo gấu trúc DataFrame
‘x2’: [9, 2, 7, 3, 3, 1, 8],
‘x3’: [‘a’, ‘b’, ‘c’, ‘d’, ‘e’, ​​’f’, ‘g’],
‘x4’: range (25, 18, – 1)})

Nếu chúng tôi muốn lưu DataFrame của chú gấu trúc này dưới dạng tệp CSV trên máy tính của mình, chúng tôi cũng phải chỉ định vị trí mà chúng tôi muốn lưu trữ nó.

Để thực hiện việc này, chúng tôi cần tải mô-đun os sang Python :

 

import

os

# Tải mô-đun hệ điều hành

nhập hệ điều hành # Tải mô-đun hệ điều hành

Bây giờ, chúng ta có thể sử dụng hàm chdir để chỉ định đường dẫn đến một thư mục mà chúng ta muốn sử dụng trong ví dụ này:

 

os

.

chdir

(

'C: / Users / Joach / Desktop / my directory' < / p>

)

# Đặt thư mục làm việc

os.chdir (‘C: / Users / Joach / Desktop / my directory ‘) # Đặt thư mục làm việc

Và cuối cùng, chúng tôi có thể xuất tập dữ liệu mẫu của chúng tôi dưới dạng tệp CSV sang thư mục này bằng cách sử dụng to_csv chức năng:

 data. 

to_csv

(

'data.csv'

)

# Xuất DataFrame của gấu trúc

data.to_csv (‘data.csv’) # Xuất DataFrame của gấu trúc

Sau khi thực thi các mã Python trước đó, thư mục làm việc trông như thế này:

example csv tệp python

Như bạn có thể thấy, thư mục làm việc của chúng tôi chứa một tệp CSV. Tệp này chứa DataFrame của gấu trúc mà chúng tôi đã tạo ở trên.

Trong các ví dụ sau, tôi sẽ chỉ ra các cách khác nhau về cách tải những dữ liệu này dưới dạng DataFrame của gấu trúc sang Python.

Hãy làm điều này!

Ví dụ 1: Nhập tệp CSV dưới dạng gấu trúc DataFrame Sử dụng hàm read_csv ()

Trong ví dụ 1, tôi sẽ trình bày cách đọc tệp CSV dưới dạng DataFrame của gấu trúc sang Python bằng cách sử dụng cài đặt mặc định của hàm read_csv.

Hãy xem xét cú pháp Python bên dưới:

 data_import1 

=

pd.

read_csv

(

'data.csv'

)

# Đọc DataFrame của gấu trúc từ CSV

print

(

data_import1

)

# In DataFrame gấu trúc đã nhập

data_import1 = pd.read_csv (‘data.csv’) # Đọc DataFrame của gấu trúc từ CSV
print (data_import1) # In DataFrame gấu trúc đã nhập

table 1 DataFrame đọc tệp csv dưới dạng pandas dataframe python

Bảng 1 cho thấy cấu trúc của DataFrame gấu trúc mà chúng tôi vừa tạo: Nó bao gồm bảy hàng và năm cột.

Như bạn có thể thấy trong mã Python trước, chúng tôi không phải chỉ định đường dẫn đến thư mục làm việc nơi chứa tệp CSV. Lý do cho điều này là chúng tôi đã đặt thư mục làm việc hiện tại đã có trong phần trước (tức là Dữ liệu mẫu & amp; Thư viện).

Trong trường hợp bạn chưa chỉ định thư mục làm việc, bạn sẽ phải thực hiện việc đó bằng cách sử dụng hàm chdir như đã giải thích trong phần trước; Hoặc bạn sẽ phải chỉ định đường dẫn đến thư mục làm việc trước tên tệp trong hàm read_csv (tức là pd.read_csv (‘C: / Users / Joach / Desktop / my directory / data.csv’)).

Lưu ý rằng cột đầu tiên của DataFrame đầu ra ở trên chứa giá trị chỉ mục . Trong ví dụ tiếp theo, tôi sẽ chỉ cách tránh điều đó, vì vậy hãy tiếp tục đọc!

Ví dụ 2: Đọc tệp CSV mà không có cột chỉ mục không có tên

Trong ví dụ 2, tôi sẽ trình bày cách tải tệp CSV dưới dạng DataFrame của gấu trúc với không có cột chỉ mục Không tên .

Để thực hiện điều này, chúng tôi phải đặt đối số index_col bằng [0] như được hiển thị trong cú pháp Python sau:

 data_import2 

=

pd.

read_csv

(

'data.csv'

,

# Đọc DataFrame của gấu trúc từ CSV

index_col

=

[

0

]

)

print

(

data_import2

)

# In DataFrame gấu trúc đã nhập

data_import2 = pd.read_csv (‘data.csv’, # Đọc DataFrame của gấu trúc từ CSV
index_col = [0])
print (data_import2) # In DataFrame gấu trúc đã nhập

table 2 DataFrame đọc tệp csv dưới dạng pandas dataframe python

Như được hiển thị trong Bảng 2, chúng tôi đã tạo một DataFrame gấu trúc khác không chứa cột chỉ mục Không tên (như trong Ví dụ 1).

Ví dụ 3: Chỉ tải các cột cụ thể từ tệp CSV

Cũng có thể tạo DataFrame gấu trúc chỉ chứa một số biến từ tệp CSV .

Mã lập trình Python sau giải thích cách thực hiện điều đó dựa trên tệp mẫu của chúng tôi.

Đối với điều này, chúng tôi phải chỉ định danh sách tên cột cho đối số usecols trong hàm read_csv.

Hãy xem mã ví dụ bên dưới:

 data_import3 

=

pd.

read_csv

(

'data.csv'

,

# Đọc DataFrame của gấu trúc từ CSV

usecols

=

[

'x2'

,

'x4'

] < / p>

)

print

(

data_import3

)

# In DataFrame của gấu trúc đã nhập

data_import3 = pd.read_csv (‘data.csv’, # Đọc DataFrame của gấu trúc từ CSV
usecols = [‘x2’, ‘x4’])
print (data_import3) # In DataFrame gấu trúc đã nhập

table 3 DataFrame đọc tệp csv dưới dạng pandas dataframe python

Bảng 3 cho thấy kết quả của cú pháp Python trước: Một DataFrame gấu trúc chỉ bao gồm các biến x2 và x4.

Ví dụ 4: Bỏ qua một số hàng nhất định khi đọc tệp CSV

Trong Ví dụ 3, tôi đã minh họa cách bỏ qua các cột nhất định khi nhập tập dữ liệu từ tệp CSV. Ngược lại, ví dụ này trình bày cách tránh các hàng cụ thể của tệp CSV .

Đối với tác vụ này, chúng ta có thể sử dụng đối số bỏ qua như được hiển thị bên dưới. Như bạn có thể thấy, chúng tôi phải chỉ định một danh sách các số hàng mà chúng tôi không muốn đọc cho đối số này.

Lưu ý rằng chúng tôi đang đồng thời sử dụng đối số index_col (như được giải thích trong Ví dụ 2) để loại trừ các chỉ số khỏi tệp CSV của chúng tôi.

 data_import4 

=

pd.

read_csv

(

'data.csv'

,

# Đọc DataFrame của gấu trúc từ CSV

index_col

=

[

0

]

,

bỏ qua

=

[

2

,

3

,

< p> 5

]

)

print

(

data_import4

)

# In DataFrame của gấu trúc đã nhập

data_import4 = pd.read_csv (‘data.csv’, # Đọc DataFrame của gấu trúc từ CSV
index_col = [0],
bỏ qua = [2, 3, 5])
print (data_import4) # In DataFrame của gấu trúc đã nhập

table 4 DataFrame đọc tệp csv dưới dạng pandas dataframe python

Như được hiển thị trong Bảng 4, chúng tôi đã tạo DataFrame gấu trúc trong đó một số dòng của tệp CSV chưa được nhập. Điều này có thể đặc biệt hữu ích khi chúng tôi xử lý các tập dữ liệu lớn.

Ví dụ 5: Đặt Tên Cột Mới khi Đọc Tệp CSV

Một điều khác mà chúng tôi có thể làm khi mở tệp CSV là chúng tôi sửa đổi tên của các biến trong tệp này.

Phần này giải thích cách thay đổi tên cột của tệp CSV trong quá trình đọc.

Đối với tác vụ này, chúng tôi phải gán danh sách các chuỗi ký tự mà chúng tôi muốn đặt làm tên cột mới cho đối số tên của hàm read_csv.

Hơn nữa, bạn nên bỏ qua hàng đầu tiên trong dữ liệu đầu vào của chúng tôi, vì hàng này chứa tiêu đề gốc của tệp CSV của chúng tôi.

Hãy thực hiện điều này trong thực tế:

 data_import5 

=

pd.

read_csv

(

'data.csv'

,

# Đọc DataFrame của gấu trúc từ CSV

index_col

=

[

0

]

,

bỏ qua

=

1

,

tên

=

[

'col1'

,

'col2'

, < / p>

'col3'

,

'col4'

]

)

print

(

data_import5

)

# In DataFrame của gấu trúc đã nhập

data_import5 = pd.read_csv (‘data.csv’, # Đọc DataFrame của gấu trúc từ CSV
index_col = [0],
bỏ qua = 1,
names = [‘col1’, ‘col2’, ‘col3’, ‘col4’])
print (data_import5) # In DataFrame của gấu trúc đã nhập

table 5 DataFrame đọc tệp csv dưới dạng pandas dataframe python

Bảng 5 hiển thị đầu ra của mã lập trình Python trước đó – Chúng tôi đã tải tệp CSV của mình dưới dạng DataFrame gấu trúc nơi chúng tôi đã chuyển đổi tên cột thành tên mới.

Video & amp; Tài nguyên khác

Bạn có muốn tìm hiểu thêm về cách nhập và phân tích cú pháp tệp CSV dưới dạng DataFrame của gấu trúc không? Sau đó, tôi có thể khuyên bạn nên xem video sau trên kênh YouTube của mình. Trong video, tôi giải thích nội dung của bài đăng này bằng Python.

Video YouTube sẽ sớm được thêm vào.

Ngoài ra, bạn có thể đọc các bài viết khác trên www.st Statisticsglobe.com. Dưới đây liệt kê một số bài viết về cách xử lý tệp CSV và các chủ đề liên quan khác.

Trên trang này, bạn đã học cách đọc và phân tích cú pháp tệp CSV dưới dạng DataFrame gấu trúc bằng ngôn ngữ lập trình Python. Hãy cho tôi biết trong phần nhận xét, nếu bạn có bất kỳ câu hỏi nào khác.


Xem thêm những thông tin liên quan đến chủ đề đọc csv dưới dạng python khung dữ liệu

Python Pandas Tutorial 4: Read Write Excel CSV File

alt

  • Tác giả: codebasics
  • Ngày đăng: 2017-02-04
  • Đánh giá: 4 ⭐ ( 3342 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: This tutorial covers how to read/write excel and csv files in pandas. We will cover,
    1) Different options on cleaning up messy data while reading csv/excel files
    2) Use convertors to transform data read from excel file
    3) Export only portion of dataframe to excel file

    Topics that are covered in this Python Pandas Video:
    0:00 Introduction
    1:26 Read CSV file using read_csv() method
    2:39 Skip rows in dataframe using “skiprows”
    4:44 Import data from CSV file with “null header”
    6:28 Read limited data from CSV file
    7:19 Clean up messy data from file “not available” and “n.a.” replace with “na_values”
    9:01 Supply dictionary for replace with “na_values”
    11:40 Write dataframe into “csv” file with “to_csv() method”
    15:27 Read excel file using read_excel() method
    18:03 Converters argument in read_excel() method
    20:17 Write dataframe into “excel” file with “to_excel() method”
    22:56 Use ExcelWritter() class
    25:13 All properties for Read Write Excel CSV File

    Do you want to learn technology from me? Check https://codebasics.io/ for my affordable video courses.

    Very Simple Explanation Of Neural Network: https://www.youtube.com/watch?v=ER2It2mIagI

    Code (jupyter notebook link): https://github.com/codebasics/py/tree/master/pandas/4_read_write_to_excel

    Next Video:
    Python Pandas Tutorial 5: Handle Missing Data: fillna, dropna, interpolate: https://www.youtube.com/watch?v=EaGbS7eWSs0&list=PLeo1K3hjS3uuASpe-1LjfG5f14Bnozjwy&index=5

    Popular Playlist:
    Complete python course: https://www.youtube.com/playlist?list=PLeo1K3hjS3uv5U-Lmlnucd7gqF-3ehIh0

    Data science course: https://www.youtube.com/playlist?list=PLeo1K3hjS3us_ELKYSj_Fth2tIEkdKXvV

    Machine learning tutorials: https://www.youtube.com/playlist?list=PLeo1K3hjS3uvCeTYTeyfe0-rN5r8zn9rw

    Pandas tutorials: https://www.youtube.com/playlist?list=PLeo1K3hjS3uuASpe-1LjfG5f14Bnozjwy

    Git github tutorials: https://www.youtube.com/playlist?list=PLeo1K3hjS3usJuxZZUBdjAcilgfQHkRzW

    Matplotlib course: https://www.youtube.com/playlist?list=PLeo1K3hjS3uu4Lr8_kro2AqaO6CFYgKOl

    Data structures course: https://www.youtube.com/playlist?list=PLeo1K3hjS3uu_n_a__MI_KktGTLYopZ12

    Data Science Project – Real Estate Price Prediction: https://www.youtube.com/watch?v=rdfbcdP75KI&list=PLeo1K3hjS3uu7clOTtwsp94PcHbzqpAdg

    To download csv and code for all tutorials: go to https://github.com/codebasics/py, click on a green button to clone or download the entire repository and then go to relevant folder to get access to that specific file.

    🌎 My Website For Video Courses: https://codebasics.io/

    Need help building software or data analytics and AI solutions? My company https://www.atliq.com/ can help. Click on the Contact button on that website.

    Facebook: https://www.facebook.com/codebasicshub
    Twitter: https://twitter.com/codebasicshub

Đọc file csv trong python

  • Tác giả: laptrinhcanban.com
  • Đánh giá: 4 ⭐ ( 3519 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Hướng dẫn cách xử lý file CSV trong python. Bạn sẽ học được cách đọc file csv trong python dưới dạng list bằng hàm csv.reader hay dưới dạng dictionary bằng class csv.DictReader. Bạn cũng sẽ học được c

Đọc ghi file CSV trong Python

  • Tác giả: yeulaptrinh.vn
  • Đánh giá: 3 ⭐ ( 8173 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: CSV là từ viết tắt Comma Separated Values, có nghĩa là giá trị được phân tách bởi dấu phẩy. CSV được dùng để lưu trữ dữ liệu dạng table.

Làm cách nào để đọc nhiều tệp dưới dạng khung dữ liệu riêng biệt và thực hiện các phép tính trên một cột?

  • Tác giả: isolution.pro
  • Đánh giá: 5 ⭐ ( 1108 lượt đánh giá )
  • Khớp với kết quả tìm kiếm:

Đọc file CSV trong Python

  • Tác giả: www.elib.vn
  • Đánh giá: 3 ⭐ ( 1796 lượt đánh giá )
  • Khớp với kết quả tìm kiếm:

PYTHON: Nhập tệp CSV dưới dạng DataFrame gấu trúc

  • Tác giả: vi.androidnetc.org
  • Đánh giá: 4 ⭐ ( 2523 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Cách Python đọc trong tệp CSV thành DataFrame của gấu trúc là gì (sau đó tôi có thể sử dụng cho các hoạt động thống kê, có thể có các cột được đánh kiểu khác, v.v.)? Tệp CSV của tôi “value.txt” có

Chi tiết bài học 24.Đọc và ghi tệp CSV trong Python bằng Mô-đun CSV & Pandas

  • Tác giả: vimentor.com
  • Đánh giá: 4 ⭐ ( 2204 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Vimentor chi tiết bài học Đọc và ghi tệp CSV trong Python bằng Mô-đun CSV & Pandas

Xem thêm các bài viết khác thuộc chuyên mục: Kiến thức lập trình

Xem Thêm  Tìm chuỗi Python () - .find làm gì trong python