初学者都在坑里!不要在Python中使用“+”来连接字符串

本文转载自公众号“读芯术”(ID:AI_Discovery)

很多初学者都像我一样,最开始使用Python时,会不自觉地使用“+”来连接字符串,就像在许多其他编程语言(比如Java)中那样,因为这样既直观又容易。

但我很快意识到成熟的开发人员似乎更喜欢使用.join()来连接字符串,而不是“+”。

你现在一定像我刚知道这一点时一样困惑。本文中,我将告诉你这两种方法之间的区别,以及为什么不应该使用“+”。

初学者都在坑里!不要在Python中使用“+”来连接字符串

开始

作为一名初学者,或者刚从使用“+”连接字符串的其他编程语言切换过来的人,很顺手地就会写出这样的代码:

str1 =“I love” 
str2 =“Python.” print(str1 + str2) 

初学者都在坑里!不要在Python中使用“+”来连接字符串

但时间久了,你或许或许就会发现,别人都是这样写的:

str1 =“I love” 
str2 =“Python.” print(''.join([str1,str2])) 
初学者都在坑里!不要在Python中使用“+”来连接字符串

实话说,当我第一次看到上述方法时,我认为这既不直观也不美观。

连接多个字符串

转折发生在不久之后,有一次我需要连接列表中的多个字符串。

strs = ['Life','is','short','I','use','Python'] 

最初,我是这样做的:

strs = ['Life', 'is', 'short,','I', 'use', 'Python']def join_strs(strs): 
    result = '' 
    for s in strs: 
        result += ' ' + s 
    return result[1:]join_strs(strs) 
初学者都在坑里!不要在Python中使用“+”来连接字符串

我必须编写一个for循环来逐个连接字符串。另外,结果字符串前需要删除我在开头添加的空格,因为所有字符串都需要在前面添加空格,而不是单是开头。

或许你有其他解决方案,例如将索引添加到for循环中,这样就不应将index=0处的字符串添加到此空格处。无论如何,你仍然需要使用此for循环并为空格做些什么。

这时,我回想起以前曾经看过.join()方法,灵光乍现,也许这正是我需要使用它的时候!

初学者都在坑里!不要在Python中使用“+”来连接字符串

超轻松解决了!一行代码可以完成所有工作。由于.join()方法是由字符串对象调用的,该字符串对象将用于连接列表中的每个字符串,因此你无需担心开头的空格。

但这不是我们需要使用join()而不是“+”方法的唯一原因。

join()方法背后的逻辑

让我们来比较一下这两种方法的性能,使用Jupyter Notebook的魔术方法%timeit来对其进行评估。

初学者都在坑里!不要在Python中使用“+”来连接字符串

上面显示的性能基于10万条路径,结果是非常可信且显而易见的。使用join()方法可能比使用“+”来连接列表中的字符串快4倍。

这是为什么呢?看看我绘制的概念图,用于演示使用“+”连接字符串的方法:

初学者都在坑里!不要在Python中使用“+”来连接字符串
使用“+”运算符和for循环将字符串连接

这显示了for循环和“+”运算符的作用:

  • 对于每个循环,都可以从列表中找到字符串
  • 对于每个循环,执行程序将需要申请两次内存地址,一次用于空格,另一次用于字符串。
  • Python执行程序解释表达式result + =''+s并为空格申请内存地址。
  • 然后,执行程序意识到空格需要与字符串连接,因此它将为字符串s申请内存地址,这是第一个循环“life”。
  • 其中还存在12次内存分配。

那么,使用join()方法发生了什么?

初学者都在坑里!不要在Python中使用“+”来连接字符串
使用“ join()”方法将字符串连接到列表中
  • 执行程序将计算列表中有多少个字符串。这里有6个。
  • 这意味着用于连接列表的字符串需要重复6-1 =5次。
  • 这里总共需要11个内存空间,因此所有的这些空间将被立即应用并被预先分配。
  • 然后按顺序排列字符串,再返回结果页面。

很明显,主要的区别在于内存分配的次数,这就是提高性能的主要原因。想象一下,使用join()方法将6个字符串连接在一起,速度已经快了4倍。如果我们连接了大量的字符串呢?它将发生更大的变化!

在Python中连接字符串时,显然,考虑到其性能,join()方法是首选。

相关推荐