range函数⽤法完全解读
迭代器是 23 种设计模式中最常⽤的⼀种(之⼀),在 Python 中随处可见它的⾝影,我们经常⽤到它,但是却不⼀定意识到它的存在。在关于迭代器的系列⽂章中(链接见⽂末),我⾄少提到了23 种⽣成迭代器的⽅法。有些⽅法是专门⽤于⽣成迭代器的,还有⼀些⽅法则是为了解决别的问题⽽“暗中”使⽤到迭代器。
在系统学习迭代器之前,我⼀直以为range() ⽅法也是⽤于⽣成迭代器的,现在却突然发现,它⽣成的只是可迭代对象,⽽并不是迭代器!(PS:Python2 中 range() ⽣成的是列表,本⽂基于Python3,⽣成的是可迭代对象)
于是,我有了这样的疑问:为什么 range() 不⽣成迭代器呢?在查答案的过程中,我发现⾃⼰对 range 类型的认识存在⼀些误区。因此,本⽂将和⼤家全⾯地认识⼀下 range ,期待与你共同学习进步。
1、range() 是什么?
它的语法:range(start, stop [,step]) ;start 指的是计数起始值,默认是0;stop 指的是计数结束值,但不包括stop ;step 是步长,默认为 1,不可以为 0 。range() ⽅法⽣成⼀段左闭右开的整数范围。
对于range() 函数,有⼏个注意点:(1)它表⽰的是左闭右开区间;(2)它接收的参数必须是整数,可以是负数,但不能是浮点数等其它类型;(3)它是不可变的序列类型,可以进⾏判断元素、查元素、切⽚等操作,但不能修改元素;(4)它是可迭代对象,却不是迭代器。
2、为什么range()不⽣产迭代器?represent的用法
可以获得迭代器的内置⽅法很多,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,但是像 range() 这样仅
可以获得迭代器的内置⽅法很多,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,但是像 range() 这样仅仅得到的是可迭代对象的⽅法就绝⽆仅有了(若有反例,欢迎告知)。这就是我存在知识误区的地⽅。
在for-循环遍历时,可迭代对象与迭代器的性能是⼀样的,即它们都是惰性求值的,在空间复杂度与时间复杂度上并⽆差异。我曾概括过两者的差别是“⼀同两不同”:相同的是都可惰性迭代,不同的是可迭代对象不⽀持⾃遍历(即next()⽅法),⽽迭代器本⾝不⽀持切⽚(即__getitem__() ⽅法)。
虽然有这些差别,但很难得出结论说它们哪个更优。现在微妙之处就在于,为什么给 5 种内置⽅法都设计了迭代器,偏偏给 range() ⽅法设计的就是可迭代对象呢?把它们都统⼀起来,不是更好么?
事实上,Pyhton 为了规范性就⼲过不少这种事,例如,Python2 中有 range() 和 xrange() 两种⽅法,⽽ Python3 就⼲掉了其中⼀种,还⽤了“李代桃僵”法。为什么不更规范点,令 range() ⽣成的是迭代器呢?
关于这个问题,我没到官⽅解释,以下纯属个⼈观点。
zip() 等⽅法都需要接收确定的可迭代对象的参数,是对它们的⼀种再加⼯的过程,因此也希望马上产出确定的结果来,所以Python 开发者就设计了这个结果是迭代器。这样还有⼀个好处,即当作为参数的可迭代对象发⽣变化的时候,作为结果的迭代器因为是消耗型的,不会被错误地使⽤。
⽽range() ⽅法就不同了,它接收的参数不是可迭代对象,本⾝是⼀种初次加⼯的过程,所以设计它为可迭代对象,既可以直接使⽤,也可以⽤于其它再加⼯⽤途。例如,zip() 等⽅法就完全可以接收 range 类型的参数。
也就是说,range() ⽅法作为⼀种初级⽣产者,它⽣产的原料本⾝就有很⼤⽤途,早早把它变为迭代器的话,⽆疑是⼀种画蛇添⾜的⾏为。
对于这种解读,你是否觉得有道理呢?欢迎就这个话题与我探讨。
3、range 类型是什么?
以上是我对“为什么range()不产⽣迭代器”的⼀种解答。顺着这个思路,我研究了⼀下它产⽣的range 对象,⼀研究就发现,这个 range 对象也并不简单。
⾸先奇怪的⼀点就是,它竟然是不可变序列!我从未注意过这⼀点。虽然说,我从未想过修改range() 的值,但这⼀不可修改的特性还是令我惊讶。
翻看⽂档,官⽅是这样明确划分的——有三种基本的序列类型:列表、元组和范围(range)对象。(There are three basic sequence types: lists, tuples, and range objects.)
这我倒⼀直没注意,原来 range 类型居然跟列表和元组是⼀样地位的基础序列!我⼀直记挂着字符串是不可变的序列类型,不曾想,这⾥还有⼀位不可变的序列类型呢。
那 range 序列跟其它序列类型有什么差异呢?
普通序列都⽀持的操作有 12 种。range 序列只⽀持其中的 10 种,不⽀持进⾏加法拼接与乘法重复。
那么问题来了:同样是不可变序列,为什么字符串和元组就⽀持上述两种操作,⽽偏偏 range 序列不⽀持呢?虽然不能直接修改不可变序列,但我们可以将它们拷贝到新的序列上进⾏操作啊,为何 range 对象连这都不⽀持呢?
且看官⽅⽂档的解释:
…due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.
原因是 range 对象仅仅表⽰⼀个遵循着严格模式的序列,⽽重复与拼接通常会破坏这种模式…
问题的关键就在于range 序列的pattern,仔细想想,其实它表⽰的就是⼀个等差数列啊(喵,⾼中数学知识没忘…),拼接两个等差数列,或者重复拼接⼀个等差数列,想想确实不妥,这就是为啥 range 类型不⽀持这两个操作的原因了。由此推论,其它修改动作也会破坏等差数列结构,所以统统不给修改就是了。
4、⼩结
回顾全⽂,我得到了两个偏冷门的结论:range 是可迭代对象⽽不是迭代器;range 对象是不可变的等差序列。
若单纯看结论的话,你也许没有感触,或许还会说这没啥了不得啊。但如果我追问,为什么 range 不是迭代器呢,为什么range 是不可变序列呢?对这俩问题,你是否还能答出个⾃圆其说的设计思想呢?(PS:我决定了,若有机会⾯试别⼈,我必要问这两个问题的嘿~)
由于 range 对象这细微⽽有意思的特性,我觉得这篇⽂章写得值了。本⽂是作为迭代器系列⽂章的⼀篇来写的,所以对于迭代器的基础知识介绍不多,另外,还有⼀种特殊的迭代器也值得单独成⽂,那就是⽣成器了。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论