为了让咱们了解Python有什么类型的编程形式,掌握Python的根本语法,清楚怎样熟知输出及指令行参数的运用,对Python的数据类型了解后,以便做更多的相关操作。
常见的编程形式
1Python交互式指令编程
2Python脚本编程
3中文编码处理
交互式指令编程形式
交互式指令编程形式便是一种典型逐行读取履行形式。
当程序只要一行或较少的时分,这种编程形式是比较典型的运用方式。
下图运用PythonIDLE编辑器进行编程,而该编辑器的编程形式便是典型的交互式指令编符号
>>>便是输入交互指令的提示符,每次输入完毕后回车,该指令就被Python解析器履行。
脚本编程形式
当咱们需求编写较为复杂或大段的代码的时分,指令式编程就显得不够方便。
因而,Python供给了脚本编程形式。可以创建一个后缀名为*.py的脚本文件,将很多的代码编写到该文件中,这样便于代码的维护和更新,之后再运用交互指令履行或IDE东西运转即可。
字符编程
字符串是一种数据类型。可是,字符串还有一个比较特殊的编码问题。
由于计算机只能处理数字,假如要处理文本,就必须先把文本转换为数字才干处理。
补充:字符编码发展史
最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表明的最大的整数便是255(二进制11111111=十进制255),假如要表明更大的整数,就必须用更多的字节。比方两个字节可以表明的最大整数是65535,4个字节可以表明的最大整数是4294967295。
由于计算机是美国人发明的,因而,最早只要127个字符被编码到计算机里,也便是巨细写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比方大写字母A的编码是65,小写字母z的编码是122。
▲扩展:unicode字符集
?Python3之所以可以很好地解决中文乱码问题,在于其将一切的字符串都是用unicode进行字符编码。
?Unicode把一切的语言一致到一套编码里,这样就不会有乱码了。
?Unicode也在不断的发展,但最常用的是用两个字节表明一个字符(假如遇到非常冷僻的字符,就需求4字节)。现在咱们见到的大多数操作系统和大多数编程语言都支撑unicode。
ASCII编码是1个字节,而Unicode编码通常是2个字节
▲扩展:UTF-8字符集
新的问题又呈现了:假如一致成Unicode编码,乱码问题从此消失了。可是,假如你写的文本根本上全部是英文的话,用Unicode编码比ASCII编码需求多一倍的存储空间,在存储和传输上就非常不划算。
解决办法的诞生:又呈现了把Unicode编码转化为“可变长编码”的UTF-8编码。
?UTF-8编码把一个Unicode字符依据不同的数字巨细编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只要很冷僻的字符才会被编码成4-6个字节。
?假如你要传输的文本包括很多英文字符,用UTF-8编码就能节约空间。
?UTF-8编码有一个额外的优点,便是ASCII编码实际上可以被看成是UTF-8编码的一部分,所以,很多只支撑ASCII编码的历史留传软件可以在UTF-8编码下继续作业。
特别注意:计算机内存中,一致运用Unicode编码
▲python3字符编码
在Python3版本中,字符串都是以Unicode编码的,也便是说,Python字符串支撑多语言。
单个字符的编码,Python供给了ord()函数获取单个字符的十进制整数表明,chr()函数把编码转换成对应的字符。
示例:
>>>ord(‘A’)
65
>>>ord(‘中’)
20013
>>>chr(66)
‘B’
>>>chr(25991)
‘文’
左右拉动检查完好指令
Python源代码也是一个文本文件,所以,当你的源代码中包括中文的时分,在保存源代码时,就需求务必指定保存为UTF-8编码。当Python解说器读取源代码时,为了让它按UTF-8编码读取,咱们通常在文件开头写上这行
#-*-coding:utf-8*-
左右拉动检查完好指令
注释是为了告知Python解说器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。