Python列表推导式进阶：从基础到性能优化-CFANZ编程社区

列表推导式是Python中最具辨识度的语法之一，它能将循环、条件判断浓缩成一行代码，大幅提升开发效率。但很多开发者只停留在基础用法，没充分发挥它的潜力，甚至因不当使用导致性能问题。本文从基础语法到进阶技巧，再到性能优化，带你全面掌握列表推导式的正确打开方式。

一、先回顾：列表推导式的基础用法

列表推导式的核心是“用简洁的语法生成列表”，基础结构为：[表达式 for 元素 in 可迭代对象 if 条件]。先从最常见的场景入手，巩固基础认知。

1. 基础场景：替代简单for循环

比如要生成1到10的平方列表，传统for循环需要4行代码，列表推导式一行就能完成：

# 传统for循环
square_list = []
for i in range(1, 11):
    square_list.append(i ** 2)
print(square_list)  # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

# 列表推导式
square_list = [i ** 2 for i in range(1, 11)]
print(square_list)  # 结果相同

2. 基础场景：带条件过滤

如果只需要偶数的平方，添加条件判断即可：

# 只保留偶数的平方
even_square = [i ** 2 for i in range(1, 11) if i % 2 == 0]
print(even_square)  # [4, 16, 36, 64, 100]

基础用法的优势很明显：代码行数减少，可读性更高（熟悉语法后，比循环更直观）。但遇到嵌套结构或复杂逻辑时，就需要进阶用法了。

二、进阶用法：处理复杂场景

实际开发中，列表推导式常用来处理嵌套数据、多条件过滤、甚至与函数结合，这些进阶用法能进一步简化代码。

1. 进阶1：嵌套列表推导（处理二维列表）

比如要将二维列表[[1,2,3], [4,5,6], [7,8,9]]展平成一维列表，传统循环需要嵌套，列表推导式只需一层嵌套语法：

# 二维列表展平
nested_list = [[1,2,3], [4,5,6], [7,8,9]]

# 传统嵌套循环
flat_list = []
for sublist in nested_list:
    for num in sublist:
        flat_list.append(num)
print(flat_list)  # [1,2,3,4,5,6,7,8,9]

# 嵌套列表推导式（注意顺序：外层循环在前，内层循环在后）
flat_list = [num for sublist in nested_list for num in sublist]
print(flat_list)  # 结果相同

再比如，要筛选出二维列表中大于5的偶数，添加条件判断：

# 筛选二维列表中大于5的偶数
filtered = [num for sublist in nested_list for num in sublist if num > 5 and num % 2 == 0]
print(filtered)  # [6, 8]

2. 进阶2：多条件判断与分支

列表推导式支持多条件分支，比如根据数值范围给元素分类：

# 根据数值范围分类：小于3→'small'，3-7→'medium'，大于7→'large'
num_list = [1, 4, 8, 2, 6, 9, 3]
category_list = [
    'small' if num < 3 
    else 'medium' if num <=7 
    else 'large' 
    for num in num_list
]
print(category_list)  # ['small', 'medium', 'large', 'small', 'medium', 'large', 'medium']

3. 进阶3：结合函数处理复杂逻辑

如果处理逻辑复杂，可先定义函数，再在推导式中调用，兼顾简洁与可读性：

# 定义函数：判断是否为质数
def is_prime(n):
    if n <= 1:
        return False
    for i in range(2, int(n ** 0.5) + 1):
        if n % i == 0:
            return False
    return True

# 用列表推导式筛选100以内的质数
primes = [num for num in range(2, 101) if is_prime(num)]
print(primes)  # [2, 3, 5, 7, 11, ..., 97]

这种方式既保留了推导式的简洁，又通过函数拆分复杂逻辑，代码更易维护。

三、性能优化：避免常见陷阱

列表推导式虽然简洁，但在处理大数据时，若用法不当，会出现内存占用过高、执行速度慢等问题。这部分讲解三个关键优化技巧。

1. 优化1：用生成器表达式替代列表推导式（减少内存占用）

列表推导式会一次性生成整个列表并放入内存，处理百万级数据时，内存占用会非常高。比如生成1000万条数据，列表推导式会直接占用数百MB内存，而生成器表达式（将[]改为()）会按需生成元素，内存占用极低。

import sys

# 列表推导式：生成1000万条数据，内存占用高
large_list = [i for i in range(10_000_000)]
print(f"列表推导式内存占用：{sys.getsizeof(large_list)} 字节")  # 约80MB（因Python版本略有差异）

# 生成器表达式：按需生成，内存占用极低
large_generator = (i for i in range(10_000_000))
print(f"生成器表达式内存占用：{sys.getsizeof(large_generator)} 字节")  # 约200字节

适用场景：当数据量极大，且不需要同时操作所有元素（如遍历处理、分批写入文件）时，优先用生成器表达式。

2. 优化2：避免在推导式中嵌套复杂计算

列表推导式的表达式部分若包含复杂计算（如多层函数调用、循环），会显著降低执行速度。优化方案是：将复杂计算提前拆分，或用更高效的方法替代。

比如要计算1到10万每个数的“平方+开方”结果，先看低效写法：

import math
import time

# 低效：推导式中嵌套两次函数调用
start = time.time()
result = [math.sqrt(i ** 2) for i in range(1, 100_001)]
end = time.time()
print(f"低效写法耗时：{end - start:.4f} 秒")  # 约0.02秒（数据量小时差异不明显）

优化后：先简化计算逻辑（math.sqrt(i**2)等价于abs(i)），减少函数调用：

# 优化：用abs()替代math.sqrt(i**2)，减少计算量
start = time.time()
result = [abs(i) for i in range(1, 100_001)]
end = time.time()
print(f"优化写法耗时：{end - start:.4f} 秒")  # 约0.005秒，速度提升4倍

核心原则：推导式中的表达式越简单越好，复杂逻辑优先用预处理或高效函数替代。

3. 优化3：合理使用条件位置（减少判断次数）

列表推导式的条件判断有“过滤条件”和“分支条件”两种，位置不同，执行效率也不同。过滤条件（if在末尾）会先循环再判断，分支条件（if-else在表达式中）会边循环边判断，需根据场景选择。

比如要生成1到10万的列表，其中偶数保留原值，奇数设为0：

# 方式1：分支条件（边循环边判断，每个元素都执行一次条件）
start = time.time()
result1 = [i if i % 2 == 0 else 0 for i in range(1, 100_001)]
end = time.time()
print(f"分支条件耗时：{end - start:.4f} 秒")  # 约0.01秒

# 方式2：过滤条件+列表拼接（先筛选偶数，再补充奇数的0，判断次数减少一半）
start = time.time()
evens = [i for i in range(1, 100_001) if i % 2 == 0]
odds = [0 for i in range(1, 100_001) if i % 2 != 0]
result2 = evens + odds  # 注意：此方式会改变顺序，需根据需求判断是否适用
end = time.time()
print(f"过滤条件+拼接耗时：{end - start:.4f} 秒")  # 约0.008秒，速度略快

注意：方式2虽然速度略快，但会改变元素顺序（先所有偶数，再所有0），仅适用于对顺序无要求的场景。若需保持原顺序，仍需用分支条件。

四、避坑指南：这些错误别再犯

1. 坑1：过度嵌套导致可读性差

虽然支持多层嵌套，但嵌套超过两层后，代码可读性会急剧下降。比如三维列表展平，推导式写法已很难直观理解：

# 不推荐：三层嵌套推导式，可读性差
three_d_list = [[[1,2],[3,4]], [[5,6],[7,8]]]
flat = [num for sub1 in three_d_list for sub2 in sub1 for num in sub2]

优化方案：超过两层嵌套时，改用循环或辅助函数，优先保证可读性：

# 推荐：用循环展平，可读性更高
def flatten_three_d(lst):
    flat = []
    for sub1 in lst:
        for sub2 in sub1:
            flat.extend(sub2)  # 用extend效率比append高
    return flat

flat = flatten_three_d(three_d_list)

2. 坑2：修改原列表元素（副作用）

列表推导式应尽量保持“纯函数”特性，避免在表达式中修改原列表元素，否则可能导致意外结果：

# 错误：推导式中修改原列表元素，产生副作用
nums = [1, 2, 3]
# 意图：生成新列表，同时给原列表元素加1（不推荐）
new_nums = [num + 1 for num in nums if (num := num + 1)]  # 用海象运算符修改原元素
print(nums)  # [2, 3, 4]（原列表被意外修改）

正确做法：推导式只负责生成新列表，修改原数据单独处理：

# 正确：先处理原列表，再生成新列表
nums = [1, 2, 3]
# 单独修改原列表
nums = [num + 1 for num in nums]
# 生成新列表（无副作用）
new_nums = [num for num in nums]

3. 坑3：数据量小时盲目追求推导式

列表推导式虽好，但在数据量极小（如10个元素以内）且逻辑简单时，传统循环与推导式差异不大，此时不必强行使用推导式，优先保证代码直观：

# 数据量小时，传统循环与推导式差异不大
# 推荐：逻辑简单时，循环更易理解（尤其对新手）
simple_list = []
for name in ["Alice", "Bob", "Charlie"]:
    simple_list.append(name.upper())

# 推导式写法虽短，但优势不明显
simple_list = [name.upper() for name in ["Alice", "Bob", "Charlie"]]