Python中typing模块与类型注解的使用方法--688IT编程网

Python中typing模块与类型注解的使⽤⽅法

实例引⼊

我们知道 Python 是⼀种动态语⾔，在声明⼀个变量时我们不需要显式地声明它的类型，例如下⾯的例⼦：

a = 2

print('1 + a =', 1 + a)

运⾏结果：

1 + a = 3

这⾥我们⾸先声明了⼀个变量 a，并将其赋值为了 2，然后将最后的结果打印出来，程序输出来了正确的结果。但在这个过程中，我们没有声明它到底是什么类型。

但如果这时候我们将 a 变成⼀个字符串类型，结果会是怎样的呢？改写如下：

a = '2'

print('1 + a =', 1 + a)

运⾏结果：

TypeError: unsupported operand type(s) for +: 'int' and 'str'

直接报错了，错误原因是我们进⾏了字符串类型的变量和数值类型变量的加和，两种数据类型不同，是⽆法进⾏相加的。

如果我们将上⾯的语句改写成⼀个⽅法定义：

def add(a):

return a + 1

这⾥定义了⼀个⽅法，传⼊⼀个参数，然后将其加 1 并返回。

如果这时候如果⽤下⾯的⽅式调⽤，传⼊的参数是⼀个数值类型：

add(2)

则可以正常输出结果 3。但如果我们传⼊的参数并不是我们期望的类型，⽐如传⼊⼀个字符类型，那么就会同样报刚才类似的错误。

但⼜由于 Python 的特性，很多情况下我们并不⽤去声明它的类型，因此从⽅法定义上⾯来看，我们实际上是不知道⼀个⽅法的参数到底应该传⼊什么类型的。

这样其实就造成了很多不⽅便的地⽅，在某些情况下⼀些复杂的⽅法，如果不借助于⼀些额外的说明，我们是不知道参数到底是什么类型的。

因此，Python 中的类型注解就显得⽐较重要了。

类型注解

在 Python 3.5 中，Python PEP 484 引⼊了类型注解（type hints），在 Python 3.6 中，PEP 526 ⼜进⼀步引⼊了变量注解（Variable Annotations），所以上⾯的代码我们改写成如下写法：

a: int = 2

print('5 + a =', 5 + a)

def add(a: int) -> int:

return a + 1

具体的语法是可以归纳为两点：

在声明变量时，变量的后⾯可以加⼀个冒号，后⾯再写上变量的类型，如 int、list 等等。

在声明⽅法返回值的时候，可以在⽅法的后⾯加⼀个箭头，后⾯加上返回值的类型，如 int、list 等等。

在中，具体的格式是这样规定的：

在声明变量类型时，变量后⽅紧跟⼀个冒号，冒号后⾯跟⼀个空格，再跟上变量的类型。

在声明⽅法返回值的时候，箭头左边是⽅法定义，箭头右边是返回值的类型，箭头左右两边都要留有空格。

有了这样的声明，以后我们如果看到这个⽅法的定义，我们就知道传⼊的参数类型了，如调⽤ add ⽅法的时候，我们就知道传⼊的需要是⼀个数值类型的变量，⽽不是字符串类型，⾮常直观。

但值得注意的是，这种类型和变量注解实际上只是⼀种类型提⽰，对运⾏实际上是没有影响的，⽐如调⽤ add ⽅法的时候，我们传⼊的不是 int 类型，⽽是⼀个 float 类型，它也不会报错，也不会对参数进⾏类型转换，如：

add(1.5)

我们传⼊的是⼀个 float 类型的数值 1.5，看下运⾏结果：

2.5

可以看到，运⾏结果正常输出，⽽且 1.5 并没有经过强制类型转换变成 1，否则结果会变成 2。

因此，类型和变量注解只是提供了⼀种提⽰，对于运⾏实际上没有任何影响。

不过有了类型注解，⼀些 IDE 是可以识别出来并提⽰的，⽐如 PyCharm 就可以识别出来在调⽤某个⽅法的时候参数类型不⼀致，会提⽰ WARNING。

⽐如上⾯的调⽤，如果在 PyCharm 中，就会有如下提⽰内容：

Expected type 'int', got 'float' instead

This inspection detects type errors in function call expressions. Due to dynamic dispatch and duck typing, this is

possible in a limited but useful number of cases. Types of function parameters can be specified in docs

trings or in Python 3 function annotations.

另外也有⼀些库是⽀持类型检查的，⽐如 mypy，安装之后，利⽤ mypy 即可检查出 Python 脚本中不符合类型注解的调⽤情况。

上⾯只是⽤⼀个简单的 int 类型做了实例，下⾯我们再看下⼀些相对复杂的数据结构，例如列表、元组、字典等类型怎么样来声明。

可想⽽知了，列表⽤ list 表⽰，元组⽤ tuple 表⽰，字典⽤ dict 来表⽰，那么很⾃然地，在声明的时候我们就很⾃然地写成这样了：

names: list = ['Germey', 'Guido']

version: tuple = (3, 7, 4)

operations: dict = {'show': False, 'sort': True}

这么看上去没有问题，确实声明为了对应的类型，但实际上并不能反映整个列表、元组的结构，⽐如我们只通过类型注解是不知道 names ⾥⾯的元素是什么类型的，只知道 names 是⼀个列表 list 类型，实际上⾥⾯都是字符串 str 类型。我们也不知道version 这个元组的每⼀个元素是什么类型的，实际上是 in

t 类型。但这些信息我们都⽆从得知。因此说，仅仅凭借 list、tuple 这样的声明是⾮常“弱”的，我们需要⼀种更强的类型声明。

这时候我们就需要借助于 typing 模块了，它提供了⾮常“强“的类型⽀持，⽐如 List[str]、Tuple[int, int, int] 则可以表⽰由 str 类型的元素组成的列表和由 int 类型的元素组成的长度为 3 的元组。所以上⽂的声明写法可以改写成下⾯的样⼦：

from typing import List, Tuple, Dict

names: List[str] = ['Germey', 'Guido']

version: Tuple[int, int, int] = (3, 7, 4)

operations: Dict[str, bool] = {'show': False, 'sort': True}

这样⼀来，变量的类型便可以⾮常直观地体现出来了。

⽬前 typing 模块也已经被加⼊到 Python 标准库中，不需要安装第三⽅模块，我们就可以直接使⽤了。

typing

下⾯我们再来详细看下 typing 模块的具体⽤法，这⾥主要会介绍⼀些常⽤的注解类型，如 List、Tuple、Dict、Sequence 等等，了解了每个类型的具体使⽤⽅法，我们可以得⼼应⼿的对任何变量进⾏声明了。

在引⼊的时候就直接通过 typing 模块引⼊就好了，例如：

from typing import List, Tuple

List

List、列表，是 list 的泛型，基本等同于 list，其后紧跟⼀个⽅括号，⾥⾯代表了构成这个列表的元素类型，如由数字构成的列

表可以声明为：

var: List[int or float] = [2, 3.5]

另外还可以嵌套声明都是可以的：

var: List[List[int]] = [[1, 2], [2, 3]]

Tuple、NamedTuple

Tuple、元组，是 tuple 的泛型，其后紧跟⼀个⽅括号，⽅括号中按照顺序声明了构成本元组的元素类型，如 Tuple[X, Y] 代表了构成元组的第⼀个元素是 X 类型，第⼆个元素是 Y 类型。

⽐如想声明⼀个元组，分别代表姓名、年龄、⾝⾼，三个数据类型分别为 str、int、float，那么可以这么声明：

person: Tuple[str, int, float] = ('Mike', 22, 1.75)

同样地也可以使⽤类型嵌套。

NamedTuple，是 collections.namedtuple 的泛型，实际上就和 namedtuple ⽤法完全⼀致，但个⼈其实并不推荐使⽤NamedTuple，推荐使⽤ attrs 这个库来声明⼀些具有表征意义的类。

Dict、Mapping、MutableMapping

Dict、字典，是 dict 的泛型；Mapping，映射，是 collections.abc.Mapping 的泛型。根据官⽅⽂档，Dict 推荐⽤于注解返回类型，Mapping 推荐⽤于注解参数。它们的使⽤⽅法都是⼀样的，其后跟⼀个中括号，中括号内分别声明键名、键值的类型，如：

def size(rect: Mapping[str, int]) -> Dict[str, int]:

return {'width': rect['width'] + 100, 'height': rect['width'] + 100}

这⾥将 Dict ⽤作了返回值类型注解，将 Mapping ⽤作了参数类型注解。

MutableMapping 则是 Mapping 对象的⼦类，在很多库中也经常⽤ MutableMapping 来代替 Mapping。

Set、AbstractSet

Set、集合，是 set 的泛型；AbstractSet、是 collections.abc.Set 的泛型。根据官⽅⽂档，Set 推荐⽤于注解返回类

型，AbstractSet ⽤于注解参数。它们的使⽤⽅法都是⼀样的，其后跟⼀个中括号，⾥⾯声明集合中元素的类型，如：

def describe(s: AbstractSet[int]) -> Set[int]:

return set(s)

这⾥将 Set ⽤作了返回值类型注解，将 AbstractSet ⽤作了参数类型注解。

Sequence

Sequence，是 collections.abc.Sequence 的泛型，在某些情况下，我们可能并不需要严格区分⼀个变量或参数到底是列表 list 类型还是元组 tuple 类型，我们可以使⽤⼀个更为泛化的类型，叫做 Sequence，其⽤法类似于 List，如：

def square(elements: Sequence[float]) -> List[float]:

return [x ** 2 for x in elements]

NoReturn

NoReturn，当⼀个⽅法没有返回结果时，为了注解它的返回类型，我们可以将其注解为 NoReturn，例如：

def hello() -> NoReturn:

print('hello')

Any

Any，是⼀种特殊的类型，它可以代表所有类型，静态类型检查器的所有类型都与 Any 类型兼容，所有的⽆参数类型注解和返回类型注解的都会默认使⽤ Any 类型，也就是说，下⾯两个⽅法的声明是完全等价的：

def add(a):

return a + 1

def add(a: Any) -> Any:

return a + 1

TypeVar

TypeVar，我们可以借助它来⾃定义兼容特定类型的变量，⽐如有的变量声明为 int、float、None 都是符合要求的，实际就是代表任意的数字或者空内容都可以，其他的类型则不可以，⽐如列表 list、字典 dict 等等，像这样的情况，我们可以使⽤TypeVar 来表⽰。

例如⼀个⼈的⾝⾼，便可以使⽤ int 或 float 或 None 来表⽰，但不能⽤ dict 来表⽰，所以可以这么声明：

height = 1.75

Height = TypeVar('Height', int, float, None)

def get_height() -> Height:

return height

这⾥我们使⽤ TypeVar 声明了⼀个 Height 类型，然后将其⽤于注解⽅法的返回结果。

NewType

NewType，我们可以借助于它来声明⼀些具有特殊含义的类型，例如像 Tuple 的例⼦⼀样，我们需要将它表⽰为 Person，即⼀个⼈的含义，但但从表⾯上声明为 Tuple 并不直观，所以我们可以使⽤ NewType 为其声明⼀个类型，如：

Person = NewType('Person', Tuple[str, int, float])

person = Person(('Mike', 22, 1.75))

这⾥实际上 person 就是⼀个 tuple 类型，我们可以对其像 tuple ⼀样正常操作。

Callable

Callable，可调⽤类型，它通常⽤来注解⼀个⽅法，⽐如我们刚才声明了⼀个 add ⽅法，它就是⼀个 Callable 类型：

print(Callable, type(add), isinstance(add, Callable))

运⾏结果：

typing.Callable <class 'function'> True

在这⾥虽然⼆者 add 利⽤ type ⽅法得到的结果是 function，但实际上利⽤ isinstance ⽅法判断确实是 True。

Callable 在声明的时候需要使⽤ Callable[[Arg1Type, Arg2Type, ...], ReturnType] 这样的类型注解，将参数类型和返回值类型都要注解出来，例如：

def date(year: int, month: int, day: int) -> str:

return f'{year}-{month}-{day}'

def get_date_fn() -> Callable[[int, int, int], str]:

return date

这⾥⾸先声明了⼀个⽅法 date，接收三个 int 参数，返回⼀个 str 结果，get_date_fn ⽅法返回了这个⽅法本⾝，它的返回值类型就可以标记为 Callable，中括号内分别标记了返回的⽅法的参数类型和返回值类型。

Union

Union，联合类型，Union[X, Y] 代表要么是 X 类型，要么是 Y 类型。

联合类型的联合类型等价于展平后的类型：

Union[Union[int, str], float] == Union[int, str, float]

仅有⼀个参数的联合类型会坍缩成参数⾃⾝，⽐如：

Union[int] == int

多余的参数会被跳过，⽐如：

Union[int, str, int] == Union[int, str]

在⽐较联合类型的时候，参数顺序会被忽略，⽐如：

Union[int, str] == Union[str, int]

这个在⼀些⽅法参数声明的时候⽐较有⽤，⽐如⼀个⽅法，要么传⼀个字符串表⽰的⽅法名，要么直接把⽅法传过来：

def process(fn: Union[str, Callable]):

if isinstance(fn, str):

# str2fn and process

pass

elif isinstance(fn, Callable):

fn()

这样的声明在⼀些类库⽅法定义的时候⼗分常见。

Optional

Optional，意思是说这个参数可以为空或已经声明的类型，即 Optional[X] 等价于 Union[X, None]。

但值得注意的是，这个并不等价于可选参数，当它作为参数类型注解的时候，不代表这个参数可以不传递了，⽽是说这个参数可以传为 None。

如当⼀个⽅法执⾏结果，如果执⾏完毕就不返回错误信息，如果发⽣问题就返回错误信息，则可以这么声明：

def judge(result: bool) -> Optional[str]:

if result: return 'Error Occurred'

Generator

如果想代表⼀个⽣成器类型，可以使⽤ Generator，它的声明⽐较特殊，其后的中括号紧跟着三个参数，分别代表YieldType、SendType、ReturnType，如：

def echo_round() -> Generator[int, float, str]:

sent = yield 0

while sent >= 0:

sent = yield round(sent)

return 'Done'

在这⾥ yield 关键字后⾯紧跟的变量的类型就是 YieldType，yield 返回的结果的类型就是 SendType，最后⽣成器 return 的内容就是 ReturnType。

当然很多情况下，⽣成器往往只需要 yield 内容就够了，我们是不需要 SendType 和 ReturnType 的，可以将其设置为空，如：

def infinite_stream(start: int) -> Generator[int, None, None]:

while True:

yield start

start += 1

案例实战

接下来让我们看⼀个实际的项⽬，看看经常⽤到的类型⼀般是怎么使⽤的。

⾸先 Typing 的定义部分如下：

from typing import Set, Union, List, MutableMapping, Optional

_Find = Union[List['Element'], 'Element']

_XPath = Union[List[str], List['Element'], str, 'Element']

_Result = Union[List['Result'], 'Result']

_HTML = Union[str, bytes]

_BaseHTML = str

_UserAgent = str

_DefaultEncoding = str

_URL = str

_RawHTML = bytes

pycharm安装教程和使用_Encoding = str

_LXML = HtmlElement

_Text = str

_Search = Result

_Containing = Union[str, List[str]]

_Links = Set[str]

_Attrs = MutableMapping

_Next = Union['HTML', List[str]]

_NextSymbol = List[str]

这⾥可以看到主要⽤到的类型有 Set、Union、List、MutableMapping、Optional，这些在上⽂都已经做了解释，另外这⾥使⽤了多次 Union 来声明了⼀些新的类型，如 _Find 则要么是是 Element 对象的列表，要么是单个 Element 对象，_Result 则要么是 Result 对象的列表，要么是单个 Result 对象。另外 _Attrs 其实就是字典类型，这⾥⽤ MutableMapping 来表⽰了，没有⽤ Dict，也没有⽤ Mapping。

接下来再看⼀个 Element 类的声明：

688IT编程网

Python中typing模块与类型注解的使用方法

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

Python中typing模块与类型注解的使用方法

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式