计算机只能识别0和1,是如下所示:
从输入内容到计算机转变成0与1的代码就是编码,计算机内部有一个编码表进行一一对应。
用来存放一个0或者1的位置,就是计算机中最小的储存单位,叫做【位】,外国名字叫【bit】,也叫做【比特】。我们规定8个比特构成一个【字节】(byte),字节是计算机里最常用的单位。
美国人有ASCII码,中国人有GB2312/GBK编码,那欧洲人、阿拉伯人也有他们自己的编码方式,这就导致了乱码的产生。
print('刘德华'.encode('gbk'))
print('郭富城'.encode('utf-8'))
print(b'\xc1\xf5\xb5\xc2\xbb\xaa'.decode('gbk'))
print(b'\xe9\x83\xad\xe5\xaf\x8c\xe5\x9f\x8e'.decode('utf-8'))
# 输出结果如下:
b'\xc1\xf5\xb5\xc2\xbb\xaa'
b'\xe9\x83\xad\xe5\xaf\x8c\xe5\x9f\x8e'
刘德华
郭富城
print(type('刘德华'))
print(type(b'\xc1\xf5\xb5\xc2\xbb\xaa'))
print(type(b'\xe9\x83\xad\xe5\xaf\x8c\xe5\x9f\x8e'))
# 输出结果:、
<class 'str'>
<class 'bytes'>
<class 'bytes'>
在Python,可以使用Python操作计算机中的文件,可以读取写入文本内容、音频、表格、邮件等内容。
s = r't\nt'
print(s)
# 输出:
t\nt
s = 't\nt'
print(s)
# 输出:
t
t
总共分三步:
# text.txt中的内容为“愿你出走半生归来仍是少年”,同时与py文件处于同个文件夹中
myfile = open(r'test.txt','r')
myfilecontent = myfile.read()
print(myfilecontent)
myfile.close()
输出结果:
$python readfile.py
愿你出走半生归来仍是少年
$
文件写入也分三步:
# text.txt中的内容为“愿你出走半生归来仍是少年”,同时与py文件处于同个文件夹中
myfile = open(r'test.rtf','w')
myfile.write('我要从你的全世界路过,路过就不回来了,哈哈哈!')
myfile.close()
# 修改后的文件内容,打开后就是写入后的内容:
我要从你的全世界路过,路过就不回来了,哈哈哈!
myfile = open(r'test.rtf','a')
myfile.write('路过了,还是回来了,看不得你孤单……')
myfile.close()
# 修改后的内容为,打开文件后为写入后的内容:
我要从你的全世界路过,路过就不回来了,哈哈哈!路过了,还是回来了,看不得你孤单……
with open(r'test.rtf','a') as myfile:
myfile.write('想了想,我还是要出走。')
# 修改后的内容为,打开文件后为写入后的内容:
我要从你的全世界路过,路过就不回来了,哈哈哈!路过了,还是回来了,看不得你孤单……想了想,我还是要出走。
# b'\xe7\x9f\xa5\xe8\xa1\x8c\xe5\x90\x88\xe4\xb8\x80'
print(b'\xe7\x9f\xa5\xe8\xa1\x8c\xe5\x90\x88\xe4\xb8\x80'.decode('utf-8'))
with open(r'test.rtf','w') as myfile:
myfile.write('知行合一')
# 输出结果:
知行合一
# 修改后的内容已经在test.rtf中体现了
def content():
shuru = input('请输入任何内容:')
shuru2 = '您输入的是:' +'"'+ shuru+'"'
return shuru2
with open(r'test.rtf', 'w') as myfile:
myfile.write(content())
# 输入的内容全部写入到test.rtf文件中了