Python - 文字列と文字コードの変換(エンコード、デコード)

公開日:2019-04-17 更新日:2019-05-29
[Python]

1. 概要

文字列と文字コードの変換(エンコード、デコード)を行います。

2. 文字列から文字コード(bytes)に変換

文字列を UTF-8 に変換して、10進数と16進数でバイト列を出力します。
シフトJIS にしたい場合には、「cp932」と指定します。

data = "あいうえお".encode("utf-8")
for b in data:
	print(b, end = " ")

print("")

for b in data:
	print(hex(b)[2:], end = " ")

227 129 130 227 129 132 227 129 134 227 129 136 227 129 138
e3 81 82 e3 81 84 e3 81 86 e3 81 88 e3 81 8a

2. 文字コード(bytes)から文字列に変換

data = bytes([227, 129, 130, 227, 129, 132, 227, 129, 134, 227, 129, 136, 227, 129, 138])
print(data.decode("utf-8"))

あいうえお