Tìm hiểu về các hàm chr () và ord () trong Python và cách sử dụng chúng trong các tập lệnh của bạn.

Bạn đang xem : ord python

Làm việc với các ký tự Unicode là gì? Bạn sẽ cần các hàm ord () và chr () trong Python. Tìm hiểu chức năng của từng loại và tại sao bạn nên sử dụng chúng bằng cách đọc bài viết này.

Trong bài viết này, chúng tôi sẽ xem xét một số ví dụ về việc chuyển đổi một ký tự sang mã Unicode của nó bằng cách sử dụng hàm ord () của Python. Chúng tôi cũng sẽ xem xét hàm chr () của Unicode và Python. Vì vậy, hãy bắt đầu!

Kiến thức cơ bản về Unicode

Máy tính, về cơ bản nhất, hoạt động với các con số. Đặc biệt, các ký tự và chữ cái trên màn hình được mã hóa dưới dạng danh sách các số nguyên.

Trước Unicode, có hàng trăm kỹ thuật mã hóa ký tự riêng biệt để phân bổ các số này. Các bảng mã ký tự ban đầu này bị hạn chế về kích thước và không thể đáp ứng tất cả các ngôn ngữ trên thế giới. Unicode Consortium được thành lập để giải quyết vấn đề này. Unicode gán cho mỗi ký tự một số duy nhất, cho phép lập trình viên tạo chuỗi với các ký tự khác nhau đến từ các ngôn ngữ khác nhau, bao gồm biểu tượng cảm xúc và các ký tự đặc biệt khác.

Chuỗi (hay còn gọi là giá trị văn bản) là một kiểu dữ liệu cơ bản trong lập trình và bạn có thể gặp nhiều vấn đề có thể giải quyết bằng cách sử dụng chuỗi và Unicode. Do đó, chúng tôi khuyên bạn nên xem khóa học tương tác của chúng tôi về Làm việc với chuỗi trong Python . Nếu bạn là người mới bắt đầu hoàn chỉnh, khóa học Kiến thức cơ bản về Python của chúng tôi sẽ giúp bạn bắt đầu với Python.

Hàm ord () Làm gì?

Trong Python, hàm ord () trả về mã Unicode cho một ký tự. Hàm này nhận một văn bản có độ dài đơn vị làm đối số và trả về giá trị tương đương Unicode của tham số được chỉ định. Khi đối số là một đối tượng Unicode, phương thức ord () của Python trả về một số nguyên tương ứng với điểm mã Unicode của ký tự (hoặc giá trị của byte khi đối số là chuỗi 8 bit).

Thêm về Unicode

Các chương trình máy tính ngày nay phải có khả năng xử lý nhiều loại ký tự. Do tính toàn cầu của các ứng dụng, cùng một thông báo có thể cần được hiển thị bằng nhiều ngôn ngữ khác nhau; ví dụ: một ứng dụng có thể cần xuất một tin nhắn bằng tiếng Nga, tiếng Anh, tiếng Pháp và tiếng Nhật. Bất kỳ ngôn ngữ nào trong số này đều có thể được sử dụng để tạo nội dung web với nhiều ký tự, biểu tượng cảm xúc và các ký hiệu khác. Kiểu string của Python đại diện cho các ký tự sử dụng tiêu chuẩn Unicode, cho phép các chương trình Python tương tác và xử lý tất cả các ký tự này.

Xem Thêm  Hướng dẫn cơ bản về Python cho Vòng lặp với hàm range () - python for vòng lặp sử dụng phạm vi

Tiêu chuẩn Unicode cố gắng liệt kê tất cả các ký tự được sử dụng trong ngôn ngữ của con người; nó gán cho mỗi ký tự một số mã duy nhất. Các đặc tả Unicode thường xuyên được sửa đổi và cập nhật để phù hợp với các ngôn ngữ và ký hiệu mới.

Một ký tự là thành phần văn bản nhỏ nhất: ‘A,’ ‘B,’ ‘C,’ v.v. là tất cả các ký tự khác nhau. Các ký tự trong Unicode khác nhau tùy thuộc vào ngôn ngữ hoặc ngữ cảnh được đề cập. Ví dụ: ký tự của chữ số La Mã một (𐌠) trông giống như ký tự viết hoa ‘I’. Nhưng đây là hai ký tự riêng biệt với ý nghĩa khá khác nhau.

Tiêu chuẩn Unicode chỉ định cách các điểm mã được sử dụng để biểu diễn các ký tự. Giá trị điểm mã là một số nguyên từ 0 đến 0x10FFFF (khoảng 1,1 triệu giá trị; số thực tế hiện được gán ít hơn). Vì vậy, ví dụ: điểm mã U + 265E biểu thị ký tự ♞ với giá trị 0x265e trong tiêu chuẩn (9,822 trong hệ thập phân). Tương tự như vậy, ký tự “\” có mã điểm U + 005C, với giá trị 0x05c theo tiêu chuẩn (92 trong hệ thập phân).

Ngày nay, Unicode đã trở thành một tiêu chuẩn trong nhiều ngôn ngữ lập trình, với nhiều ngôn ngữ (bao gồm cả Python) sử dụng nó để biểu diễn chuỗi. Hơn nữa, nó được sử dụng bởi tất cả các nhà cung cấp phần mềm hiện đại và các nhà phát triển phần mềm như một cách chắc chắn để xử lý bất kỳ chuỗi đầu vào nào.

Cách sử dụng hàm ord () trong Python

Hàm ord () trong Python được sử dụng để chuyển đổi một ký tự Unicode đơn lẻ thành ký tự nguyên tương đương của nó. Hàm chấp nhận bất kỳ ký tự chuỗi đơn nào và trả về một số nguyên. Phương thức này có cú pháp sau:

ord (x) 

Ở đây x đại diện cho bất kỳ ký tự Unicode nào.

Bây giờ, hãy xem ví dụ đầu tiên của chúng tôi bằng phương pháp này:

# Chuyển đổi Unicode sang Int bằng ord ()
character = 'd'

print (ord (ký tự))

Đầu ra: 100

Hàm print () được sử dụng để xuất ra giá trị của ký tự Unicode của chúng ta. Nếu quy trình này có vẻ không quen thuộc, bạn có thể tìm hiểu thêm về quy trình này trong bài viết này về hàm in Python . Điều đáng chú ý là cả dấu nháy đơn và nháy kép đều hoạt động; ‘d’ “d” có thể là đối số của hàm ord () .

# Chuyển đổi Unicode sang Int bằng ord ()
ký tự = “d”

print (ord (ký tự))

Đầu ra: 100

Hãy cũng xem xét một ví dụ về hàm ord () với một ký tự không có trong bảng chữ cái Latinh – ví dụ: ký hiệu đô la:

# Chuyển đổi Unicode sang Int bằng ord ()
ký tự = '$'

print (ord (ký tự))

Đầu ra: 36

Nếu độ dài chuỗi lớn hơn 1, lỗi TypeError sẽ xuất hiện:

# Chuyển đổi Unicode sang Int bằng ord ()
character = 'data'

print (ord (ký tự))

Đầu ra: TypeError: ord () mong đợi một ký tự, nhưng chuỗi có độ dài 4 được tìm thấy

Chúng ta có thể thấy rằng việc sử dụng phương thức ord () với nhiều hơn một ký tự gây ra TypeError . Điều này xảy ra bởi vì hàm chỉ chấp nhận một ký tự duy nhất làm đầu vào. Để giải quyết TypeError này, chúng ta phải lặp lại từng ký tự trong chuỗi. Vì các chuỗi trong Python là các đối tượng có thể lặp lại, chúng ta có thể dễ dàng lặp lại các giá trị chuỗi sau:

string = 'data'
cho chữ cái trong chuỗi:
    print (ord (letter))

Đầu ra:
100
97
116
97

Một điểm quan trọng cần lưu ý là 128 điểm Unicode đầu tiên giống với giá trị ASCII. Về cơ bản, điều này có nghĩa là các ký tự và giá trị ASCII tương ứng của chúng sẽ tương đương với cùng một giá trị Unicode.

Xem Thêm  Các biến JavaScript - biến html trong javascript

Ví dụ:

ký tự = ‘9’
print ("Giá trị ASCII của 9 =", ord (ký tự))

Đầu ra: Giá trị ASCII của 9 = 57

Giá trị ASCII cho ký tự ‘9’ là 57; như bạn có thể thấy, giá trị này cũng tương đương với giá trị điểm Unicode của nó.

Nếu điều này có vẻ quá sức, đừng lo lắng; chúng tôi có bạn bảo hiểm. Như câu nói cũ, thực hành tạo nên sự hoàn hảo, vì vậy chúng tôi khuyên bạn nên xem bài viết này để tìm hiểu cách tốt nhất để thực hành Python . Nếu bạn muốn tiến xa hơn và thực hành các kỹ năng Python của mình, chúng tôi thực sự khuyên bạn nên xem khóa học tương tác của LearnPython.com, Thực hành Python: Trò chơi chữ . Nó sẽ giúp bạn thực hành các hàm ord () chr () và làm việc tốt hơn với Unicode. Nếu bạn muốn tìm hiểu thêm về khóa học, hãy xem bài viết này về LearnPython’s Python Practice: Word Games .

Hàm chr ()

Hàm chr () trong Python biến biểu diễn số nguyên thành ký tự chuỗi Unicode tương đương của nó. Nói cách khác, nó đối lập với hàm ord () . Hàm này nhận bất kỳ số nào trong khoảng từ 0 đến 1.114.111 để đại diện cho tất cả các ký tự Unicode.

Cú pháp của hàm chr () trong Python như sau:

chr (i) 

Trong đó i là một số nguyên, đại diện cho một điểm mã Unicode của một ký tự.

Ví dụ:

result = chr (102)

in (kết quả)

Đầu ra: f

Nếu một giá trị nằm ngoài phạm vi được đề cập ở trên được chuyển vào hàm, thì hàm sẽ tạo ra ValueError . Hãy xem nó trông như thế nào:

result = chr (1114115)

in (kết quả)

Đầu ra: ValueError: chr () arg không trong phạm vi (0x110000)

Hàm này cũng chỉ nhận một giá trị; để chuyển đổi nhiều số nguyên, chúng tôi sẽ phải lặp lại tất cả các giá trị:

số nguyên = [100, 97, 116, 97, 103, 121]

cho số nguyên trong số nguyên:
   print (chr (integer))

# Đầu ra:
d
một
t
một

Chúng tôi có thể tiến xa hơn và biến danh sách các số này thành một chuỗi Python. Điều này khớp với văn bản của chúng tôi, 'data' , mà chúng tôi đã chuyển đổi sang Unicode trong ví dụ trước. Chúng ta có thể sử dụng phương thức .join () để thực hiện việc này:

số nguyên = [100, 97, 116, 97, 103, 121]
result = list () # Đang khởi tạo một danh sách trống

cho số nguyên trong số nguyên:
   result.append (chr (integer)) # thêm ký tự vào mảng kết quả

Final = ‘’ .join (kết quả)

in (kết quả)

Dữ liệu đầu ra

Ngoài chr () và ord () trong Lập trình Python

Trong ngành lập trình, tiêu chuẩn Unicode đã mang tính cách mạng. Mọi ký tự đều được gán một giá trị số, từ chữ cái đến ký hiệu đến biểu tượng cảm xúc. Ngoài ra, tiêu chuẩn này giúp máy tính hiểu các ký hiệu dễ dàng hơn nhiều, đặc biệt là khi nhiều ký tự được thêm vào Internet.

Xem Thêm  Game Đế Chế, Age of Empires 1.0, 2.0, 3.0 -taimienphi.v

Chúng tôi đã học được nhiều điều về hàm ord () của Python trong hướng dẫn này. Mỗi ký tự có một giá trị Unicode duy nhất và ord ()Hàm có thể được sử dụng để kiểm tra các giá trị số hoặc ký tự đặc biệt. Chúng ta cũng đã tìm hiểu về hàm chr () , hàm này đối lập với hàm ord () . Và chúng tôi đã xem một số ví dụ để giúp củng cố cả hai khái niệm.

Bây giờ, tất cả những gì bạn cần làm là thực hành sử dụng chr () ord () trong Python. Chúng tôi thực sự khuyên bạn nên xem Khóa học Python’s Practice: Word Games của LearnPython và bắt đầu hành trình trở thành một người thành thạo Python.


Xem thêm những thông tin liên quan đến chủ đề ord python là gì

How to Use Python’s ord and chr Functions

  • Tác giả: MrKennedySTEM
  • Ngày đăng: 2016-02-06
  • Đánh giá: 4 ⭐ ( 7583 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: For full ASCII chart, see here: http://www.theasciicode.com.ar/

    For more instructional videos and materials: http://mrkennedyscience.weebly.com/

Câu hỏi

  • Tác giả: helpex.vn
  • Đánh giá: 3 ⭐ ( 5820 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Helpex – Trao Đổi & Giúp Đỡ – chia sẻ, hỏi đáp kiến thức các lĩnh vực, gặp gỡ các chuyên gia kế toán, it…

Liệt kê hiểu và ord () trong Python để xóa tất cả các ký tự không phải bảng chữ cái

  • Tác giả: vn.wsxdn.com
  • Đánh giá: 5 ⭐ ( 9429 lượt đánh giá )
  • Khớp với kết quả tìm kiếm:

Object Oriented Programming

  • Tác giả: www.codehub.com.vn
  • Đánh giá: 3 ⭐ ( 2097 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Đa số các đoạn code mà chúng ta tham khảo ở các bài học trước đây được viết theo kiểu **hướng thủ tục**. Lập trình hướng thủ tục (procedure programming) là một phương pháp lập trình mà trong đó các câu lệ…

Toán tử thao tác bit trong python

  • Tác giả: laptrinhcanban.com
  • Đánh giá: 3 ⭐ ( 9975 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Hướng dẫn sử dụng toán tử thao tác bit trong python, hay còn gọi là toán tử bitwise trong Python hoặc là toán tử Biwter trong Python. Bạn sẽ học được cách viết cũng như cách sử dụng các toán tử thao t

Python là gì? 13 lý do bạn nên học ngôn ngữ lập trình Python

  • Tác giả: ironhackvietnam.edu.vn
  • Đánh giá: 4 ⭐ ( 4843 lượt đánh giá )
  • Khớp với kết quả tìm kiếm: Python là gì? Tại sao nên học ngôn ngữ lập trình Python ngay lúc này? Hãy tìm hiểu ngay 13 lý do Ironhack Việt Nam tổng hợp dưới đây nhé.

Phần tử không trong Python

  • Tác giả: www.vithon.org
  • Đánh giá: 3 ⭐ ( 8240 lượt đánh giá )
  • Khớp với kết quả tìm kiếm:

Xem thêm các bài viết khác thuộc chuyên mục: Kiến thức lập trình

By ads_php