编码
默认情况下,Python 3 源码文件以UTF-8编码,所有的字符串都是unicode字符串。当然,也可以为源码文件指定不同的编码:
1 | # -*- coding: cp-1252 -*- |
上述定义允许在源文件中使用 Windows-1252 字符集中的字符编码,对应适合语言为保加利亚语、白罗斯语、马其顿语、俄语、塞尔维亚语。
标识符
标识符是对对象引用起的一个名字。在python中,需要遵循以下规则:
- 长度任意长
- 不能和python 3的关键字,即保留字,同名
- 标识符ASCII字母、下划线以及大多数非英文语言的字母,只要是Unicode编码的字母都可以充当引导字符,后续字符可以是任意引导符,或任意非空格字符,包括Unicode编码中认为是数字的任意字符
- 不要使用Python预定义的标识符名,因此要避免使用NotImplemented与Eliiipsis等名字,这些在未来有可能被Python的新版本使用到
- 不要使用Python内置函数名或内置数据类型或异常名作为标识符名
- 关于下划线的约定,名字的开头和结尾都使用下划线的情况应该避免,因为Python中大量采用这种名字定义了各种特殊方法和变量;在有些情况,以一个或两个下划线引导的名称,但是没有使用两个下划线结尾的应该特殊对待
保留字
保留字即关键字,不能被用作任何的标识符名称。python的标准库提供了一个keyword模块,可以输出当前版本的所有关键字。
1 | import keyword |
注释
python 中有3种注释方式:
- 单行注释以
#
开头 - 多行注释用三个单引号
'''
,将被注释语句包围起来 - 多行注释用三个双引号
"""
,将被注释语句包围起来1
2
3
4
5
6
7
8
9
10# 单行注释
"""
这是多行注释
这是多行注释
"""
'''
这也是多行注释
这也是多行注释
'''
行与缩进
python和其他语言最大的区别就是它使用缩进来表示代码块,不需要使用大括号{}
。
缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进格数。
1 | s = set([1, 2, 3, 4]) |
多行语句
Python 通常是一行写完一条语句,但如果语句很长,我们可以使用反斜杠()来实现多行语句
1 | s = set([1, 2, 3 \ |
运算符
python 3 支持一下类型的运算符。
算数运算符
运算符 | 描述 | 实例 |
---|---|---|
+ | 加 两个对象相加 | a = 1; b = 2; a + b = 3 |
- | 减 两个对象相减 | a = 1; b = 2; a - b = -1 |
* | 乘 两个对象相乘 | a = 1; b = 2; a * b = 2 |
/ | 除 两个对象相除 | a = 1; b = 2; a / b = 0.5 |
% | 取模 返回除法的余数 | a = 1; b = 2; a % b = 1 |
** | 幂 返回x的y次幂 | a = 1; b = 2; a ** b = 1 |
// | 取整除 返回商的整数部分(向下取整) | a = 1; b = 2; a // b = 0 |
关系运算符
运算符 | 描述 | 实例 |
---|---|---|
== | 等于 比较两个对象是否相等 | a = 1; b = 2; a == b false |
!= | 不等于 比较两个对象是否不相等 | a = 1; b = 2; a != b true |
<> | 不等于 比较两个对象是否不相等 | a = 1; b = 2; a <> b true |
> | 大于 返回x是否大于y | a = 1; b = 2; a > b false |
< | 小于 返回x是否小于y。 | a = 1; b = 2; a < b true |
>= | 大于等于 返回x是否大于等于y | a = 1; b = 2; a >= b false |
<= | 小于等于 返回x是否小于等于y | a = 1; b = 2; a <= b true |
赋值运算符
运算符 | 描述 | 实例 |
---|---|---|
= | 赋值运算符 | a = 1; b = 2; c = a + b |
+= | 加法赋值运算符 | c += a 等效于 c = c + a |
-= | 减法赋值运算符 | c -= a 等效于 c = c - a |
*= | 乘法赋值运算符 | c *= a 等效于 c = c * a |
/= | 除法赋值运算符 | c /= a 等效于 c = c / a |
%= | 取模赋值运算符 | c %= a 等效于 c = c % a |
**= | 幂赋值运算符 | c **= a 等效于 c = c ** a |
//= | 取整除赋值运算符 | c //= a 等效于 c = c // a |
逻辑运算符
运算符 | 描述 | 实例 |
---|---|---|
and | a and b | 布尔 与 -如果a为False,a and b 返回False,否则它返回b的计算值 |
or | a or b | 布尔 或 -如果a为True,a and b 返回True,否则它返回b的计算值 |
not | not a | 布尔 非 -如果a为True,返回False,如果a为False,它返回True |
位运算符
假设a为60,b为13
成员运算符
运算符 | 描述 | 实例 |
---|---|---|
in | 如果在指定的序列中找到值返回 True,否则返回 False。 | x 在 y 序列中 , 如果 x 在 y 序列中返回 True。 |
not in | 如果在指定的序列中没有找到值返回 True,否则返回 False。 | x 不在 y 序列中 , 如果 x 不在 y 序列中返回 True。 |
身份运算符
运算符 | 描述 | 实例 |
---|---|---|
is | is 是判断两个标识符是不是引用自一个对象 | x is y, 类似 id(x) == id(y) , 如果引用的是同一个对象则返回 True,否则返回 False |
is not | is not 是判断两个标识符是不是引用自不同对象 | x is not y , 类似 id(a) != id(b)。如果引用的不是同一个对象则返回结果 True,否则返回 False。 |
运算符优先级
以下表格给出了从最高到最低优先级的所有运算符
条件控制
Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。
可以通过下图来简单了解条件语句的执行过程
if语句
python中if语句的一般形式如下所示:
1 | if condition_1: |
· 如果“condition_1”为True,将执行statement_block_1块语句
· 如果“condition_2”为False,将判断“condition_2”
· 如果“condition_2”为True,将执行statement_block_2块语句
· 如果“condition_2”为False,将执行statement_block_3块语句
Python中使用了elif
代替了 else if
,所以 if
语句的关键字为:if-wlif-else
。
注意:
· 每个条件后面要使用冒号 :,表示接下来是满足条件后要执行的语句块。
· 使用缩进来划分语句块,相同缩进数的语句在一起组成一个语句块。
· 在Python中没有switch – case语句。
1 | # a = 15 |
if 嵌套
在嵌套 if
语句中,可以把 if...elif...else
结构放在另外一个 if...elif...else
结构中。
1 | if 表达式1: |
示例:
1 | # !/usr/bin/python3 |
while循环
Python中的循环语句有for和while。
python循环语句的控制结构图如下所示:
while语句的一般形式如下:
1 | while 判断条件: |
同样需要注意冒号和缩进。另外,在python中没有do...while
循环。
以下示例使用了while来计算1到100的总和:
1 | #!/usr/bin/env python3 |
无限循环
我们可以通过设置条件表达式永远不为 false 来实现无限循环,实例如下:
1 | #!/usr/bin/python3 |
执行以上脚本,输出结果如下:
1 | 输入一个数字 :5 |
你可以使用 CTRL+C
来退出当前的无限循环。
无限循环在服务器上客户端的实时请求非常有用。
while 循环使用else语句
在 while … else
在条件语句为 false
时执行 else
的语句块:
1 | #!/usr/bin/python3 |
执行以上脚本,输出结果如下:
1 | 0 小于 5 |
for循环
Python for循环可以遍历任何序列的项目,如一个列表或者一个字符串。
for循环的一般格式如下:
1 | for <variable> in <sequence>: |
Python loop循环实例:
1 | languages = ["C", "C++", "Perl", "Python"] |
break和continue语句及循环中的else子句
break 语句可以跳出 for 和 while 的循环体。如果你从 for 或 while 循环中终止,任何对应的循环 else 块将不执行。 实例如下:
1 | #!/usr/bin/python3 |
执行以上脚本输出结果为:
1 | 当前字母为 : R |
continue语句被用来告诉Python跳过当前循环块中的剩余语句,然后继续进行下一轮循环。
1 | #!/usr/bin/python3 |
执行以上脚本输出结果为:
1 | 当前字母 : R |
循环语句可以有 else 子句,它在穷尽列表(以for循环)或条件变为 false (以while循环)导致循环终止时被执行,但循环被break终止时不执行。
如下实例用于查询质数的循环例子:
1 | #!/usr/bin/python3 |
执行以上脚本输出结果为:
1 | 2 是质数 |
pass
Python pass是空语句,是为了保持程序结构的完整性。
pass 不做任何事情,一般用做占位语句,如下实例
1 | while True: |
最小的类:
1 | class MyEmptyClass: |
以下实例在字母为 o 时 执行 pass 语句块:
1 | #!/usr/bin/python3 |
执行以上脚本输出结果为:
1 | 当前字母 : R |
迭代器与生成器
迭代器
迭代是Python最强大的功能之一,是访问集合元素的一种方式。
迭代器是一个可以记住遍历的位置的对象。
迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
迭代器有两个基本的方法:iter() 和 next()。
字符串,列表或元组对象都可用于创建迭代器:
1 | list=[1, 2, 3, 4] |
迭代器对象可以使用常规for语句进行遍历:
1 | #!/usr/bin/python3 |
也可以使用 next() 函数:
1 | #!/usr/bin/python3 |
创建一个迭代器
把一个类作为一个迭代器使用需要在类中实现两个方法 iter() 与 next() 。
如果你已经了解的面向对象编程,都支持类都有一个构造函数,Python 的构造函数为 init(), 它会在对象初始化的时候执行。
iter() 方法返回一个特殊的迭代器对象, 这个迭代器对象实现了 next() 方法并通过 StopIteration 异常标识迭代的完成。
next() 方法(Python 2 里是 next())会返回下一个迭代器对象。
创建一个返回数字的迭代器,初始值为 1,逐步递增 1:
1 | class MyNumbers: |
执行输出结果为:
1 | 1 |
StopIteration
StopIteration 异常用于标识迭代的完成,防止出现无限循环的情况,在 next() 方法中我们可以设置在完成指定循环次数后触发 StopIteration 异常来结束迭代。
在 20 次迭代后停止执行:
1 | class MyNumbers: |
执行输出结果为:
1 | 1 |
生成器
在 Python 中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。
调用一个生成器函数,返回的是一个迭代器对象。
以下实例使用 yield 实现斐波那契数列:
1 | #!/usr/bin/python3 |
执行以上程序,输出结果如下:
1 | 0 1 1 2 3 5 8 13 21 34 55 |
函数
函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。
函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。
定义一个函数
你可以定义一个由自己想要功能的函数,以下是简单的规则:
· 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号 ()。
· 任何传入参数和自变量必须放在圆括号中间,圆括号之间可以用于定义参数。
· 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。
· 函数内容以冒号起始,并且缩进。
· return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None。
语法
Python 定义函数使用 def 关键字,一般格式如下:
1 | def 函数名(参数列表): |
默认情况下,参数值和参数名称是按函数声明中定义的顺序匹配起来的。
函数调用
定义一个函数:给了函数一个名称,指定了函数里包含的参数,和代码块结构。
这个函数的基本结构完成以后,你可以通过另一个函数调用执行,也可以直接从 Python 命令提示符执行。
如下实例调用了 printme() 函数:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 我要调用用户自定义函数! |
参数传递
在 python 中,类型属于对象,变量是没有类型的:
1 | a=[1,2,3] |
以上代码中,[1,2,3] 是 List 类型,”Runoob” 是 String 类型,而变量 a 是没有类型,她仅仅是一个对象的引用(一个指针),可以是指向 List 类型对象,也可以是指向 String 类型对象。
(mutable)与不可更改(immutable)对象
在 python 中,strings, tuples, 和 numbers 是不可更改的对象,而 list,dict 等则是可以修改的对象。
·`不可变类型`:变量赋值 a=5 后再赋值 a=10,这里实际是新生成一个 int 值对象 10,再让 a 指向它,而 5 被丢弃,不是改变a的值,相当于新生成了a。
·`可变类型`:变量赋值 la=[1,2,3,4] 后再赋值 la[2]=5 则是将 list la 的第三个元素值更改,本身la没有动,只是其内部的一部分值被修改了。
python 函数的参数传递:
·`不可变类型`:类似 c++ 的值传递,如 整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在 fun(a)内部修改 a 的值,只是修改另一个复制的对象,不会影响 a 本身。
·`可变类型`:类似 c++ 的引用传递,如 列表,字典。如 fun(la),则是将 la 真正的传过去,修改后fun外部的la也会受影响
python 中一切都是对象,严格意义我们不能说值传递还是引用传递,我们应该说传不可变对象和传可变对象。
python 传不可变对象实例
1 | #!/usr/bin/python3 |
实例中有 int 对象 2,指向它的变量是 b,在传递给 ChangeInt 函数时,按传值的方式复制了变量 b,a 和 b 都指向了同一个 Int 对象,在 a=10 时,则新生成一个 int 值对象 10,并让 a 指向它。
传可变对象实例
可变对象在函数里修改了参数,那么在调用这个函数的函数里,原始的参数也被改变了。例如:
1 | #!/usr/bin/python3 |
传入函数的和在末尾添加新内容的对象用的是同一个引用。故输出结果如下:
1 | 函数内取值: [10, 20, 30, [1, 2, 3, 4]] |
参数
以下是调用函数时可使用的正式参数类型:
·必需参数
·关键字参数
·默认参数
·不定长参数
必需参数
必需参数须以正确的顺序传入函数。调用时的数量必须和声明时的一样。
调用printme()函数,你必须传入一个参数,不然会出现语法错误:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | Traceback (most recent call last): |
关键字参数
关键字参数和函数调用关系紧密,函数调用使用关键字参数来确定传入的参数值。
使用关键字参数允许函数调用时参数的顺序与声明时不一致,因为 Python 解释器能够用参数名匹配参数值。
以下实例在函数 printme() 调用时使用参数名:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 菜鸟教程 |
以下实例中演示了函数参数的使用不需要使用指定顺序:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 名字: runoob |
默认参数
调用函数时,如果没有传递参数,则会使用默认参数。以下实例中如果没有传入 age 参数,则使用默认值:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 名字: runoob |
不定长参数
你可能需要一个函数能处理比当初声明时更多的参数。这些参数叫做不定长参数,和上述 2 种参数不同,声明时不会命名。基本语法如下:
1 | def functionname([formal_args,] *var_args_tuple ): |
加了星号 * 的参数会以元组(tuple)的形式导入,存放所有未命名的变量参数。
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 输出: |
如果在函数调用时没有指定参数,它就是一个空元组。我们也可以不向函数传递未命名的变量。如下实例:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 输出: |
还有一种就是参数带两个星号 **
基本语法如下:
1 | def functionname([formal_args,] **var_args_dict ): |
加了两个星号 **
的参数会以字典的形式导入。
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 输出: |
声明函数时,参数中星号 *
可以单独出现,例如:
1 | def f(a,b,*,c): |
如果单独出现星号 * 后的参数必须用关键字传入。
1 | def f(a,b,*,c): |
匿名函数
python 使用 lambda 来创建匿名函数。
所谓匿名,意即不再使用 def 语句这样标准的形式定义一个函数。
· lambda 只是一个表达式,函数体比 def 简单很多。
· lambda的主体是一个表达式,而不是一个代码块。仅仅能在lambda表达式中封装有限的逻辑进去。
· lambda 函数拥有自己的命名空间,且不能访问自己参数列表之外或全局命名空间里的参数。
· 虽然lambda函数看起来只能写一行,却不等同于C或C++的内联函数,后者的目的是调用小函数时不占用栈内存从而增加运行效率。
语法
lambda 函数的语法只包含一个语句,如下:
1 | lambda [arg1 [,arg2,.....argn]]:expression |
如下实例:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 相加后的值为 : 30 |
return语句
return [表达式] 语句用于退出函数,选择性地向调用方返回一个表达式。不带参数值的return语句返回None。之前的例子都没有示范如何返回数值,以下实例演示了 return 语句的用法:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 函数内 : 30 |
变量作用域
Python 中,程序的变量并不是在哪个位置都可以访问的,访问权限决定于这个变量是在哪里赋值的。
变量的作用域决定了在哪一部分程序可以访问哪个特定的变量名称。Python的作用域一共有4种,分别是:
· L (Local) 局部作用域
· E (Enclosing) 闭包函数外的函数中
· G (Global) 全局作用域
· B (Built-in) 内建作用域
以 L –> E –> G –>B 的规则查找,即:在局部找不到,便会去局部外的局部找(例如闭包),再找不到就会去全局找,再者去内建中找。
1 | x = int(2.9) # 内建作用域 |
Python 中只有模块(module),类(class)以及函数(def、lambda)才会引入新的作用域,其它的代码块(如 if/elif/else/、try/except、for/while等)是不会引入新的作用域的,也就是说这些语句内定义的变量,外部也可以访问,如下代码:
1 | if True: |
实例中 msg 变量定义在 if 语句块中,但外部还是可以访问的。
如果将 msg 定义在函数中,则它就是局部变量,外部不能访问:
1 | def test(): |
从报错的信息上看,说明了 msg_inner 未定义,无法使用,因为它是局部变量,只有在函数内可以使用。
全局变量和局部变量
定义在函数内部的变量拥有一个局部作用域,定义在函数外的拥有全局作用域。
局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。调用函数时,所有在函数内声明的变量名称都将被加入到作用域中。如下实例:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 函数内是局部变量 : 30 |
global 和 nonlocal关键字
当内部作用域想修改外部作用域的变量时,就要用到global和nonlocal关键字了。
以下实例修改全局变量 num:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 1 |
如果要修改嵌套作用域(enclosing 作用域,外层非全局作用域)中的变量则需要 nonlocal 关键字了,如下实例:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | 100 |
另外有一种特殊情况,假设下面这段代码被运行:
1 | #!/usr/bin/python3 |
以上程序执行,报错信息如下:
1 | Traceback (most recent call last): |
错误信息为局部作用域引用错误,因为 test 函数中的 a 使用的是局部,未定义,无法修改。
修改 a 为全局变量,通过函数参数传递,可以正常执行输出结果为:
1 | #!/usr/bin/python3 |
执行输出结果为:
1 | 11 |
模块
在前面的几个章节中我们脚本上是用 python 解释器来编程,如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了。
为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块。
模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 python 标准库的方法。
下面是一个使用 python 标准库中模块的例子。
1 | #!/usr/bin/python3 |
执行结果如下所示:
1 | python using_sys.py 参数1 参数2 |
· import sys 引入 python 标准库中的 sys.py 模块;这是引入某一模块的方法。
· sys.argv 是一个包含命令行参数的列表。
· sys.path 包含了一个 Python 解释器自动查找所需模块的路径的列表。
import语句
想使用 Python 源文件,只需在另一个源文件里执行 import 语句,语法如下:
1 | import module1[, module2[,... moduleN] |
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。
搜索路径是一个解释器会先进行搜索的所有目录的列表。如想要导入模块 support,需要把命令放在脚本的顶端:
1 | #!/usr/bin/python3 |
test.py 引入 support 模块:
1 | #!/usr/bin/python3 |
以上实例输出结果:
1 | $ python3 test.py |
一个模块只会被导入一次,不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行。
当我们使用import语句的时候,Python解释器是怎样找到对应的文件的呢?
这就涉及到Python的搜索路径,搜索路径是由一系列目录名组成的,Python解释器就依次从这些目录中去寻找所引入的模块。
这看起来很像环境变量,事实上,也可以通过定义环境变量的方式来确定搜索路径。
搜索路径是在Python编译或安装的时候确定的,安装新的库应该也会修改。搜索路径被存储在sys模块中的path变量,做一个简单的实验,在交互式解释器中,输入以下代码:
1 | import sys |
sys.path 输出是一个列表,其中第一项是空串’’,代表当前目录(若是从一个脚本中打印出来的话,可以更清楚地看出是哪个目录),亦即我们执行python解释器的目录(对于脚本的话就是运行的脚本所在的目录)。
因此若像我一样在当前目录下存在与要引入模块同名的文件,就会把要引入的模块屏蔽掉。
了解了搜索路径的概念,就可以在脚本中修改sys.path来引入一些不在搜索路径中的模块。
现在,在解释器的当前目录或者 sys.path 中的一个目录里面来创建一个fibo.py的文件,代码如下:
1 | # 斐波那契(fibonacci)数列模块 |
然后进入Python解释器,使用下面的命令导入这个模块:
1 | import fibo |
这样做并没有把直接定义在fibo中的函数名称写入到当前符号表里,只是把模块fibo的名字写到了那里。
可以使用模块名称来访问函数:
1 | >>>fibo.fib(1000) |
如果你打算经常使用一个函数,你可以把它赋给一个本地的名称:
1 | fib = fibo.fib |
from…import语句
Python 的 from 语句让你从模块中导入一个指定的部分到当前命名空间中,语法如下:
1 | from modname import name1[, name2[, ... nameN]] |
例如,要导入模块 fibo 的 fib 函数,使用如下语句:
1 | from fibo import fib, fib2 |
这个声明不会把整个fibo模块导入到当前的命名空间中,它只会将fibo里的fib函数引入进来。
from … import * 语句
把一个模块的所有内容全都导入到当前的命名空间也是可行的,只需使用如下声明:
1 | from modname import * |
这提供了一个简单的方法来导入一个模块中的所有项目。然而这种声明不该被过多地使用。
深入模块
模块除了方法定义,还可以包括可执行的代码。这些代码一般用来初始化这个模块。这些代码只有在第一次被导入时才会被执行。
每个模块有各自独立的符号表,在模块内部为所有的函数当作全局符号表来使用。
所以,模块的作者可以放心大胆的在模块内部使用这些全局变量,而不用担心把其他用户的全局变量搞花。
从另一个方面,当你确实知道你在做什么的话,你也可以通过 modname.itemname 这样的表示法来访问模块内的函数。
模块是可以导入其他模块的。在一个模块(或者脚本,或者其他地方)的最前面使用 import 来导入一个模块,当然这只是一个惯例,而不是强制的。被导入的模块的名称将被放入当前操作的模块的符号表中。
还有一种导入的方法,可以使用 import 直接把模块内(函数,变量的)名称导入到当前操作模块。比如:
1 | from fibo import fib, fib2 |
这种导入的方法不会把被导入的模块的名称放在当前的字符表中(所以在这个例子里面,fibo 这个名称是没有定义的)。
这还有一种方法,可以一次性的把模块中的所有(函数,变量)名称都导入到当前模块的字符表:
1 | from fibo import * |
这将把所有的名字都导入进来,但是那些由单一下划线(_)开头的名字不在此例。大多数情况, Python程序员不使用这种方法,因为引入的其它来源的命名,很可能覆盖了已有的定义。
__name__属性
一个模块被另一个程序第一次引入时,其主程序将运行。如果我们想在模块被引入时,模块中的某一程序块不执行,我们可以用__name__属性来使该程序块仅在该模块自身运行时执行。
1 | #!/usr/bin/python3 |
运行输出如下:
1 | $ python using_name.py |
1 | $ python |
说明: 每个模块都有一个__name__属性,当其值是’main‘时,表明该模块自身在运行,否则是被引入。
说明:name 与 main 底下是双下划线, _ _ 是这样去掉中间的那个空格。
dir() 函数
内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回:
1 | import fibo, sys |
如果没有给定参数,那么 dir() 函数会罗列出当前定义的所有名称:
1 | 1, 2, 3, 4, 5] a = [ |
标准模块
Python 本身带着一些标准的模块库,在 Python 库参考文档中将会介绍到(就是后面的”库参考文档”)。
有些模块直接被构建在解析器里,这些虽然不是一些语言内置的功能,但是他却能很高效的使用,甚至是系统级调用也没问题。
这些组件会根据不同的操作系统进行不同形式的配置,比如 winreg 这个模块就只会提供给 Windows 系统。
应该注意到这有一个特别的模块 sys ,它内置在每一个 Python 解析器中。变量 sys.ps1 和 sys.ps2 定义了主提示符和副提示符所对应的字符串:
1 | import sys |
包
包是一种管理 Python 模块命名空间的形式,采用”点模块名称”。
比如一个模块的名称是 A.B, 那么他表示一个包 A中的子模块 B 。
就好像使用模块的时候,你不用担心不同模块之间的全局变量相互影响一样,采用点模块名称这种形式也不用担心不同库之间的模块重名的情况。
这样不同的作者都可以提供 NumPy 模块,或者是 Python 图形库。
不妨假设你想设计一套统一处理声音文件和数据的模块(或者称之为一个”包”)。
现存很多种不同的音频文件格式(基本上都是通过后缀名区分的,例如: .wav,:file:.aiff,:file:.au,),所以你需要有一组不断增加的模块,用来在不同的格式之间转换。
并且针对这些音频数据,还有很多不同的操作(比如混音,添加回声,增加均衡器功能,创建人造立体声效果),所以你还需要一组怎么也写不完的模块来处理这些操作。
这里给出了一种可能的包结构(在分层的文件系统中):
1 | sound/ 顶层包 |
在导入一个包的时候,Python 会根据 sys.path 中的目录来寻找这个包中包含的子目录。
目录只有包含一个叫做 init.py 的文件才会被认作是一个包,主要是为了避免一些滥俗的名字(比如叫做 string)不小心的影响搜索路径中的有效模块。
最简单的情况,放一个空的 :file:init.py就可以了。当然这个文件中也可以包含一些初始化代码或者为(将在后面介绍的) __all__变量赋值。
用户可以每次只导入一个包里面的特定模块,比如:
1 | import sound.effects.echo |
这将会导入子模块:sound.effects.echo。 他必须使用全名去访问:
1 | sound.effects.echo.echofilter(input, output, delay=0.7, atten=4) |
还有一种导入子模块的方法是:
1 | from sound.effects import echo |
这同样会导入子模块: echo,并且他不需要那些冗长的前缀,所以他可以这样使用:
1 | echo.echofilter(input, output, delay=0.7, atten=4) |
还有一种变化就是直接导入一个函数或者变量:
1 | from sound.effects.echo import echofilter |
同样的,这种方法会导入子模块: echo,并且可以直接使用他的 echofilter() 函数:
1 | echofilter(input, output, delay=0.7, atten=4) |
注意当使用from package import item这种形式的时候,对应的item既可以是包里面的子模块(子包),或者包里面定义的其他名称,比如函数,类或者变量。
import语法会首先把item当作一个包定义的名称,如果没找到,再试图按照一个模块去导入。如果还没找到,恭喜,一个:exc:ImportError 异常被抛出了。
反之,如果使用形如import item.subitem.subsubitem这种导入形式,除了最后一项,都必须是包,而最后一项则可以是模块或者是包,但是不可以是类,函数或者变量的名字。
从一个包中导入*
设想一下,如果我们使用 from sound.effects import *会发生什么?
Python 会进入文件系统,找到这个包里面所有的子模块,一个一个的把它们都导入进来。
但是很不幸,这个方法在 Windows平台上工作的就不是非常好,因为Windows是一个大小写不区分的系统。
在这类平台上,没有人敢担保一个叫做 ECHO.py 的文件导入为模块 echo 还是 Echo 甚至 ECHO。
(例如,Windows 95就很讨厌的把每一个文件的首字母大写显示)而且 DOS 的 8+3 命名规则对长模块名称的处理会把问题搞得更纠结。
为了解决这个问题,只能烦劳包作者提供一个精确的包的索引了。
导入语句遵循如下规则:如果包定义文件 init.py 存在一个叫做 all 的列表变量,那么在使用 from package import * 的时候就把这个列表中的所有名字作为包内容导入。
作为包的作者,可别忘了在更新包之后保证 all 也更新了啊。你说我就不这么做,我就不使用导入*这种用法,好吧,没问题,谁让你是老板呢。这里有一个例子,在:file:sounds/effects/init.py中包含如下代码:
1 | __all__ = ["echo", "surround", "reverse"] |
这表示当你使用from sound.effects import *这种用法时,你只会导入包里面这三个子模块。
如果 all 真的没有定义,那么使用from sound.effects import *这种语法的时候,就不会导入包 sound.effects 里的任何子模块。他只是把包sound.effects和它里面定义的所有内容导入进来(可能运行__init__.py里定义的初始化代码)。
这会把 init.py 里面定义的所有名字导入进来。并且他不会破坏掉我们在这句话之前导入的所有明确指定的模块。看下这部分代码:
1 | import sound.effects.echo |
这个例子中,在执行from…import前,包sound.effects中的echo和surround模块都被导入到当前的命名空间中了。(当然如果定义了__all__就更没问题了)
通常我们并不主张使用*这种方法来导入模块,因为这种方法经常会导致代码的可读性降低。不过这样倒的确是可以省去不少敲键的功夫,而且一些模块都设计成了只能通过特定的方法导入。
记住,使用from Package import specific_submodule这种方法永远不会有错。事实上,这也是推荐的方法。除非是你要导入的子模块有可能和其他包的子模块重名。
如果在结构中包是一个子包(比如这个例子中对于包sound来说),而你又想导入兄弟包(同级别的包)你就得使用导入绝对的路径来导入。比如,如果模块sound.filters.vocoder 要使用包sound.effects中的模块echo,你就要写成 from sound.effects import echo。
1 | from . import echo |
无论是隐式的还是显式的相对导入都是从当前模块开始的。主模块的名字永远是”main“,一个Python应用程序的主模块,应当总是使用绝对路径引用。
包还提供一个额外的属性__path__。这是一个目录列表,里面每一个包含的目录都有为这个包服务的__init__.py,你得在其他__init__.py被执行前定义哦。可以修改这个变量,用来影响包含在包里面的模块和子包。
这个功能并不常用,一般用来扩展包里面的模块。
引用
本章主要参考以下文章教程
http://www.runoob.com/python3/python3-conditional-statements.html
http://www.runoob.com/python3/python3-conditional-statements.html
http://www.runoob.com/python3/python3-iterator-generator.html
http://www.runoob.com/python3/python3-function.html