学完之后做什么：Python 的三条出路¶

各位老朋友——

能读到这一章，水哥先恭喜你。

从 python0 一路走到 python27，咱们一起聊过变量、函数、面向对象、异常、文件、模块、虚拟环境、类型注解、pathlib、dataclass 与 Pydantic、上下文管理器、async/await + httpx、pyproject.toml、uv、pytest、Git 协同、CI/CD、PyPI 发包……整整二十八章，几十万字，几百段代码。各位走到这里，已经不是「只会写 print('hello')」的初学者了，而是一个能从零搭项目、能写测试、能发包、能跟团队协作的、真正意义上的 Python 工程师。

可是各位有没有发现一件事——读完这二十八章，会的东西看起来很多，可一旦关上书，又好像不知道接下来该写点啥？

这种感觉水哥太懂了。Python 的语法和工程化只是地基，地基打好了之后，往上面盖什么样的房子，得各位自己挑。Python 的世界很大——大到一辈子也学不完。但是大归大，主流方向其实就那么几个，挑一个跟着做，比漫无目的地刷教程强一百倍。

这一章水哥不教语法、不写大段代码，就给各位三个最主流的 Python 出路：

数据 / AI / 机器学习——2026 年最火的方向，Python 是 AI 的母语
Web 后端开发——开发效率高、能见度高、招聘面广
自动化运维 / 脚本 / 工具——把日常工作变成代码，Python 当年就是靠这个起家的

每个方向水哥会讲三件事：为什么选它、必备库清单、三个起点项目。挑一个最对你胃口的，把项目跟着撸完，比读十本书都顶用。

走起。

方向一：数据 / AI / 机器学习¶

为什么选这个方向¶

各位翻一翻 2026 年的招聘网站，搜「Python 工程师」三个字，跳出来的岗位大半带着「数据」、「算法」、「AI」、「LLM」、「大模型」、「机器学习」这些词。这不是巧合——Python 是 AI 时代事实上的母语。

为啥？水哥给各位讲三层原因——

第一层是生态。从 2010 年代初的 numpy/pandas，到 2015 年的 scikit-learn，到 2017 年的 tensorflow/pytorch，到 2022 年之后 transformers/langchain/openai/anthropic 各种 SDK，二十年下来，AI 圈所有重要的库第一个版本都是 Python 写的。其他语言不是不能用，是用了之后发现「跟主流社区接不上」——别人发论文用 PyTorch，你用 Julia 或者 Rust 重写一遍，论文复现都没人跟你聊。

第二层是节奏。AI 圈是一个「论文今天发，明天就有人开源代码」的圈子。这种节奏下，能一行 pip install 装上的 Python 库，比要编译半小时的 C++/Rust 库快一万倍。语言性能不是不重要，而是先跑通、再优化这个顺序在 AI 圈被压得特别极端，Python 正好是「先跑通」这一步的最优解。

第三层是钱。2026 年的 AI 工程师薪资在所有 Python 方向里最高——一线城市资深岗位 50k-80k 不算稀奇，应届生只要能讲清楚一两个 LLM 项目，起薪 30k 也很常见。这里水哥不是劝各位「为钱学 AI」，而是说——AI 方向的市场需求、薪资上限、想象空间都摆在那儿，往这个方向走的回报曲线很陡。

所以——如果各位对「让机器自己学」、「让模型替我写代码」、「让程序看图说话」这些话题感兴趣，AI 这条路水哥推荐你认真看一眼。

必备库清单¶

数据/AI 方向的库分四个层次，从下往上——

层次	代表库	干啥用的
数据基础	`numpy`、`pandas`、`matplotlib`、`jupyter`	数组、表格、画图、交互式笔记本，俗称「数据四件套」
数据增强	`polars`、`seaborn`、`plotly`	`pandas` 的 Rust 升级版、统计图美化、交互图
传统 ML	`scikit-learn`、`xgboost`、`lightgbm`	分类、回归、聚类、决策树、梯度提升
深度学习	`pytorch`、`transformers`、`huggingface_hub`	神经网络框架、预训练模型一行加载
LLM 应用	`anthropic`、`openai`、`langchain`、`llama-index`	调商业 LLM、做 RAG、做 Agent

各位看完这张表估计有点懵——「学这么多？」别慌，这张表是地图，不是清单。地图给你看「这个方向有啥风景」，真正学的时候按下面的路径来——

基础四件套先打通：numpy 算数组、pandas 处理表格、matplotlib 画图、jupyter 当画板。这四个库吃透，70% 的数据分析任务都能干。
scikit-learn 是传统 ML 的入口：决策树、随机森林、SVM、KMeans 这些经典算法都在里面，API 极其统一——fit 训练、predict 预测，三行代码跑一个模型。
transformers 是深度学习的捷径：HuggingFace 把所有主流预训练模型（BERT、GPT-2、Llama、Qwen）打包成统一接口，一行 pipeline('sentiment-analysis') 就能跑情感分析。各位不用从 PyTorch 开始啃，直接用预训练模型干活，遇到瓶颈再往下钻。
LLM SDK 是 2026 年的新基建：anthropic 调 Claude、openai 调 GPT，加上 langchain 做编排、llama-index 做 RAG，这套组合是当前「LLM 应用工程师」这个新岗位的标配。

「polars 凭啥能挑战 pandas？」这个问题水哥多说一句——polars 是 Rust 写的 DataFrame 库，速度比 pandas 快 5-10 倍，API 更现代（强类型、惰性求值、不容易写错）。2024 年之后越来越多新项目首选 polars。但是 pandas 生态太成熟、教程太多，入门还是建议从 pandas 开始，等你写多了 pandas 觉得「这语法真烦」的时候，自然就会去看 polars。

三个起点项目¶

项目 1：用 `pandas` 分析一份公开数据集¶

做什么：从 Kaggle 下载一份 CSV（推荐 Titanic 或者 TMDB Movies），在 jupyter 里读进来，做 5 个分析：缺失值统计、分布直方图、相关性热力图、分组聚合、画一张能讲故事的图
难度：★☆☆☆☆
代码量：100-200 行
学到啥：pandas 的 read_csv/groupby/merge/pivot_table 全套基础操作；matplotlib 和 seaborn 画图；用 jupyter 写「能给别人看」的分析报告

这个项目水哥强烈建议各位第一个就做。它不光教 pandas，还培养一个 AI 工程师必备的习惯——面对一份陌生数据，第一反应是去看分布、看缺失、看异常值，而不是闷头写模型。

项目 2：用 `transformers` 跑一个本地分类模型¶

做什么：用 HuggingFace 的 pipeline('sentiment-analysis') 做一个「电影评论好坏判断器」。先用预训练模型直接跑，再下载 IMDB 评论数据集做微调（fine-tune），把准确率从 85% 提到 92%
难度：★★★☆☆
代码量：200-400 行
学到啥：transformers 的 pipeline 用法、HuggingFace Hub 怎么找模型、Trainer API 微调流程、GPU 和 CPU 切换、模型保存和加载

「我没显卡咋办？」用 Google Colab。免费给 T4 GPU，跑这种小模型够用。或者用 Apple Silicon 的 MPS 后端，M 系列芯片本地训练也能跑。

项目 3：调 Claude API 写一个「PDF 总结」工具¶

做什么：写一个命令行工具，输入一个 PDF 路径，输出一份 200 字的中文总结。流程是——pypdf 抽文字 → 切成 2000 字一段 → 每段调 anthropic SDK 让 Claude 总结 → 最后再让 Claude 把所有片段总结汇总成一份
难度：★★☆☆☆
代码量：100-200 行
学到啥：anthropic SDK 用法、API key 管理（.env + python-dotenv）、长文本切分策略、prompt engineering 入门、流式输出

这个项目跟 2026 年的工作场景贴得最近。各位在公司里写一个这种工具，立马能解决「每周看 5 篇行业报告」的痛点，老板看了都想给你加薪。

方向二：Web 后端开发¶

为什么选这个方向¶

「Web 后端」听起来很老，2026 年还有人写吗？

有，而且特别多。原因很简单——所有公司都需要 API。前端框架换了一茬又一茬（Vue、React、Svelte），App 端从原生到混合到跨平台，但是后端始终在那儿，吭哧吭哧地处理请求、读数据库、调外部服务、返回 JSON。

Web 后端不会消失，只会变得更重要——因为：

AI 应用本质上是 Web 应用。各位看 ChatGPT、Claude、Cursor，前端是个聊天框，后端就是一堆 API 在调模型。LLM 工程师 90% 的工作其实是写后端，只不过加了一个「调模型」的环节。
微服务还在普及。一个公司一个大应用变成几十个小服务，每个服务都是一个 Web 后端项目。Python 在这种小服务场景下开发效率非常高。
招聘面最广。各位投简历搜「Python 后端」，全国一线城市每天新挂的岗位都是几百个起步——比 AI 岗位多，门槛也低一点。

那 Python 写后端跟 Java、Go、Node 比有啥优势？水哥说三点——

开发速度快：写一个 CRUD API，Python 大概 100 行，Java 同样的功能至少 300 行
跟 AI 生态无缝衔接：后端里要塞一段「调 LLM 处理用户输入」的逻辑，Python 一行 import 就完事
2024 年之后 Python 后端的工程化追上来了：fastapi + pydantic + sqlmodel + uv 这套现代栈，类型安全、文档自动生成、性能也跟得上，跟 Go 比不再被吊打

必备库清单¶

角色	代表库	干啥用的
Web 框架	`fastapi`、`starlette`	写 API，主流首选
数据校验	`pydantic`	请求体、响应体的类型校验，跟 `fastapi` 深度集成
ASGI 服务器	`uvicorn`、`hypercorn`、`granian`	跑 `fastapi` 的服务器，生产环境一般是 uvicorn + gunicorn
ORM	`sqlalchemy 2.x`、`sqlmodel`	操作数据库，`sqlmodel` 是 `fastapi` 作者写的 SQLAlchemy 简化版
数据库迁移	`alembic`	表结构变更管理，加一个字段、改一个类型
缓存	`redis-py`、`aiocache`	Redis 客户端、内存缓存
异步任务	`celery`、`dramatiq`、`arq`	后台跑邮件、爬虫、定时任务
认证	`python-jose`、`passlib`、`authlib`	JWT、密码哈希、OAuth
HTTP 客户端	`httpx`	调外部 API，同步异步都行
测试	`pytest`、`httpx.AsyncClient`	接口测试

「列了这么多咋下手？」从下往上分阶段——

第一阶段：单文件 API。装 fastapi 和 uvicorn，写一个 50 行的 main.py 跑起来，用浏览器打开 http://localhost:8000/docs 看自动生成的 Swagger 文档。这一步 30 分钟搞定，立马上瘾。
第二阶段：加数据库。装 sqlmodel，加一个 SQLite 数据库（不用单独装，Python 自带），写一组 CRUD 接口（增删改查）。这一步走通，你已经能写一个像样的 API 了。
第三阶段：加鉴权。装 python-jose 和 passlib，加一个 /login 接口发 JWT，加一个 Depends(get_current_user) 保护其他接口。这一步搞完，你的 API 就是「企业级」的了。
第四阶段：加异步任务。装 celery 或者更轻量的 dramatiq，把「发邮件」、「生成 PDF」这种耗时任务丢到后台跑。这一步进入「真生产」级别。

「Django 呢？」Django 5.x 在 2026 年仍然活得很好——它跟 fastapi 是两种哲学：

fastapi 是「积木式」：从空白开始，需要啥装啥，适合 API、微服务、AI 后端
django 是「全家桶式」：Admin 后台、ORM、模板、表单、用户系统全自带，适合「一个团队从零做一个完整网站」这种场景

如果你以后想做内容站、电商、企业内部系统，Django 仍然是好选择。但如果你的目标是 AI 后端、微服务、移动 App 后端，fastapi 是 2026 年的默认答案。

三个起点项目¶

项目 1：todo API（CRUD + sqlmodel）¶

做什么：写一个待办事项 API，接口包括「创建 todo」、「列出所有 todo」、「按 ID 查 todo」、「更新 todo」、「删除 todo」。数据存 SQLite，用 sqlmodel 做 ORM，用 pytest 写 5 个接口测试
难度：★☆☆☆☆
代码量：200-300 行
学到啥：fastapi 路由、pydantic 模型、sqlmodel ORM 的 select/session.add/session.commit、pytest 写接口测试、Swagger 文档怎么用

这个项目水哥建议所有想学 Web 后端的人都做一遍。它麻雀虽小，五脏俱全——做完之后，你会真切体会到「用 Python 写 API 真的快」这个事情。

项目 2：给 todo API 加 JWT 鉴权¶

做什么：在项目 1 的基础上加用户系统——加一张 User 表、一个 /register 注册接口、一个 /login 登录接口（返回 JWT）、其他接口全部加 Depends(get_current_user) 保护起来。每个 todo 关联一个 user_id，只能查/改自己的
难度：★★★☆☆
代码量：300-500 行
学到啥：JWT 的工作原理、passlib 怎么做密码哈希、fastapi 的 Depends 依赖注入、关系型数据库的外键和 join、权限的「行级隔离」

JWT 是 2026 年 Web 后端最常考的概念。这一关过了之后，看任何后端项目都不慌。

项目 3：加后台任务（celery 发邮件）¶

做什么：在项目 2 的基础上加一个功能——用户注册之后给他发欢迎邮件，但是不阻塞 API 响应。装 celery + redis，把发邮件函数标成 @app.task，注册接口里 send_welcome_email.delay(user.email) 一发就返回，邮件由 worker 在后台真去发
难度：★★★★☆
代码量：400-600 行
学到啥：消息队列的概念、celery 的 broker 和 backend、redis 怎么当队列、worker 怎么部署、为啥要异步任务（用户体验、稳定性）

这个项目做完，你已经摸到了「分布式后端」的门。后面学 Kafka、学微服务，都是基于这个思路扩展出去的。

方向三：自动化运维 / 脚本 / 工具¶

为什么选这个方向¶

各位有没有听过 Python 的外号——「胶水语言」？

这个外号不是夸 Python 跑得快、不是夸 Python 类型安全、是夸 Python 「啥都能粘一下」。Python 的标准库巨大、第三方生态庞大、跟系统调用、跟 HTTP、跟数据库、跟文件、跟 Excel、跟 PDF、跟微信、跟钉钉……几乎所有「重复劳动」的场景，都能被 Python 做成一段脚本。

这个方向有几个特点——

见效快。一段 50 行的脚本，可能立马省掉每天半小时的重复劳动。各位写完之后自己用、自己爽，根本不用什么「上线」、「评审」、「灰度」。
不依赖大公司。AI 和后端方向更适合在公司里干（要数据、要服务器、要业务），自动化方向一台笔记本就能起飞。各位甚至可以靠这个接外包、做副业。
门槛最低，但天花板也不低。最简单的脚本初学者就能写，复杂一点的「分布式爬虫」、「企业内部自动化平台」、「DevOps 工具链」也是这个方向的延伸，资深岗位照样年薪百万。

如果各位的目标是「让自己每天的工作更轻松」，或者「想做一些能马上看到效果的小项目」，自动化方向是性价比最高的选择。

必备库清单¶

用途	代表库	干啥用的
HTTP 请求	`requests`、`httpx`	调 API、爬网页，`httpx` 支持异步
网页抓取	`beautifulsoup4`、`lxml`、`playwright`、`selenium`	解析 HTML、自动控制浏览器
定时任务	`schedule`、`apscheduler`	每天 9 点跑一次、每隔 5 分钟跑一次
远程操作	`paramiko`、`fabric`	SSH 到服务器执行命令
终端 UI	`rich`、`textual`	彩色输出、表格、进度条、TUI 应用
CLI 框架	`click`、`typer`	写命令行工具，参数解析比 `argparse` 优雅十倍
配置文件	`pyyaml`、`tomllib`、`configparser`	YAML、TOML、INI 解析
文件操作	`pathlib`、`shutil`、`watchdog`	路径操作（标准库）、文件监听
办公自动化	`openpyxl`、`python-docx`、`pypdf`	Excel、Word、PDF
通知	webhook（钉钉/飞书/Slack）	出事了发消息

「这一坨咋学？」自动化方向不要按照清单学，按项目学。各位脑子里有一个「我每天/每周做的某件麻烦事」，然后用上面的库去做掉它，需要啥学啥，半年下来这个清单自然就熟了。

rich 这个库水哥必须单独夸一句。它是 Will McGugan 写的，让 Python 终端输出变彩色、变带格式，进度条、表格、Markdown 渲染、错误堆栈高亮全部内置。装了它之后，各位写的命令行工具立马「像样」了一个量级。textual 是同一个作者搞的 TUI 框架——在终端里搞出一个响应式应用，跟 Web 一样的组件化思路，可玩性极高。

三个起点项目¶

项目 1：网页变化监控 + 钉钉/飞书通知¶

做什么：监控某个网页（比如「某商品 SKU 的价格」、「某博客作者的最新文章」、「12306 的某条火车票余票」），每 10 分钟抓一次，发现变化就发钉钉/飞书 webhook 通知到群里。脚本用 apscheduler 调度，HTTP 用 httpx，HTML 解析用 beautifulsoup4
难度：★★☆☆☆
代码量：100-200 行
学到啥：HTTP GET、HTML 解析（CSS selector）、状态对比（hash 比对、diff 比对）、定时任务、webhook 怎么发

这个项目水哥自己写过好几个版本——监控博客订阅、监控演唱会票务、监控购物网站降价，都是它的变种。做完一个之后，每次想监控啥东西改两行就能新开一个，复用率超高。

项目 2：自动备份目录到 OSS / S3¶

做什么：写一个脚本，每天凌晨 2 点把指定目录（比如 ~/Documents/重要资料）打成 zip，按日期命名（backup-2026-04-28.zip），上传到阿里云 OSS 或者 AWS S3，再删除超过 30 天的旧备份。脚本用 apscheduler 调度，压缩用标准库 zipfile，上传用 oss2 或 boto3
难度：★★★☆☆
代码量：200-300 行
学到啥：文件遍历（pathlib）、zip 压缩、对象存储 SDK 用法、密钥管理（.env）、生命周期管理（按日期清理）、日志（logging）

「这有啥用？」各位平时电脑里的代码、笔记、设计稿，是不是哪天硬盘坏了就全没了？这种自动备份脚本写一次，用十年。水哥的 Mac 上现在还跑着一个 2018 年写的备份脚本，从来没改过。

项目 3：交互式 TUI 应用（rich + textual）¶

做什么：用 textual 写一个终端版的 todo 应用——左侧列表显示所有 todo、右侧详情可编辑、底部状态栏显示统计、按 n 新建、按 d 删除、按 e 编辑。数据存本地 JSON 文件
难度：★★★★☆
代码量：300-500 行
学到啥：textual 的组件、布局、事件、CSS 样式（对，TUI 也用 CSS）、键盘快捷键绑定、应用状态管理

这个项目难度稍高，但是做完之后你会发现——「原来终端里也能写出像 VSCode 一样的应用」。这种成就感是其他项目给不了的。水哥当年写完第一个 textual 应用，激动得发了个朋友圈。

横向技能：三个方向都要会的东西¶

不管各位最后挑哪个方向，下面这几样横向技能都要懂——它们是 2026 年所有 Python 工程师的「通用底盘」：

Git：除了 add / commit / push，还要会 branch / merge / rebase / cherry-pick，看得懂 git log --graph。python25 那一章已经聊过，回头再翻一遍。
Docker：把自己的 Python 项目装进容器，写一个 Dockerfile，跑 docker compose up 把应用 + 数据库 + 缓存一把启动。后端方向尤其要会。
Linux 基础：ssh / cd / ls / grep / awk / tail -f / ps / top / systemctl，会用 vim 改个配置文件。运维方向必须会，其他方向也得懂个皮毛。
SQL 基础：SELECT / JOIN / GROUP BY / WHERE / INDEX。后端和数据方向必备，自动化方向偶尔也会用到。
HTTP / REST 基本概念：GET / POST / PUT / DELETE、状态码、Cookie、JWT、CORS。三个方向都用得上。

这些不需要专门学，做项目的时候遇到了再补，半年下来就熟了。重点是不要看到不熟的概念就绕开，每次都现学现用，知识自然就长上身了。

怎么挑方向¶

各位读到这里，估计心里在打鼓——「到底选哪个？」

水哥给一个简单的判断标准——

想看 LLM 浪潮、对「让机器思考」着迷 → 选数据 / AI
想做能见度高的产品、喜欢看到成果跑在网上 → 选Web 后端
想立刻减轻自己当下的工作量、爱折腾日常工具 → 选自动化

或者更简单——哪个方向的「起点项目」让你看完想立刻动手，就选哪个。这种「想动手」的冲动，是最准的内心指南针。

「能不能混搭？」当然能。水哥自己就是「自动化 + AI」的混搭——日常用 Python 写小工具，工具里塞 LLM 调用，每个工具都比纯写脚本聪明十倍。三个方向之间没有壁垒，只要语法和工程化的地基稳，从哪条路都能走到尽头。

但是起步阶段水哥建议各位「专一」——选一个方向做半年，把上面三个项目都撸完，再考虑横向扩张。一开始三个方向同时学，结果就是三个方向都半瓶水，啥都拿不出手。

持续学习：往下走的资源¶

学到这里，各位已经从「教程读者」毕业了，接下来要自己进社区。水哥推荐这几个长期跟着的频道——

Real Python：英文社区里最优质的 Python 教程站，从基础到高级都有，每周更新两三篇深度文章
Talk Python To Me：Michael Kennedy 主持的播客，每集请一位社区名人聊一个主题，通勤的时候听
PyCon 系列演讲：YouTube 上免费看，每年 PyCon US / EU / China 都有几百个高质量演讲，挑感兴趣的看
Python Weekly：每周一封邮件，帮你过滤一周里值得看的 Python 新闻、库、项目
每年 10 月 Python 新版本发布：去 What's New in Python 看一眼新版本添了什么，跟着版本走

中文圈的话，水哥会继续在 walter201230/Python 这个仓库里更新——欢迎各位 star、watch、提 issue 提 PR。教程是死的，社区是活的，能跟一群人一起进步，比一个人闷头啃书强一万倍。

结尾的话¶

各位老朋友——

写到这里，水哥忍不住要回到 python0 那一章的开头——「学习 Python 需要一步一个脚印，踏踏实实地学。」

这句话水哥当年写下的时候，自己都没想到会陪伴各位走完二十八章。一步一个脚印，听着像废话，但是落到每一天——每天写 50 行代码、每天读一篇文档、每天 commit 一次——半年下来就是质变。水哥自己学 Python 也是这么过来的，没啥诀窍。

学完 python28，各位手里已经有了一整套Python 工程师的工具箱——语法、生态、工程化、协作流程，外加一张「下一站去哪」的地图。怎么用这套工具箱，盖出怎样的房子，从今往后是各位自己的事了。

最后水哥送给所有读到这里的老朋友三句话——

挑一个方向，做三个项目，把它们传到 GitHub。这比读一百本书都有用。
遇到搞不懂的报错先去 Google，再去 Stack Overflow，最后去问 Claude。每一次 debug 都是一次成长。
不要停。Python 在变、AI 在变、整个行业每天都在变。保持好奇心，保持动手习惯，五年之后，各位回头看 2026 年的自己，会感谢今天没有停下来的你。

祝各位前程似锦，代码常青。

我们下次再见。

—— 水哥 2026 年 4 月

学完之后做什么：Python 的三条出路¶

方向一：数据 / AI / 机器学习¶

为什么选这个方向¶

必备库清单¶

三个起点项目¶

项目 1：用 pandas 分析一份公开数据集¶

项目 2：用 transformers 跑一个本地分类模型¶

项目 3：调 Claude API 写一个「PDF 总结」工具¶

方向二：Web 后端开发¶

为什么选这个方向¶

必备库清单¶

三个起点项目¶

项目 1：todo API（CRUD + sqlmodel）¶

项目 2：给 todo API 加 JWT 鉴权¶

项目 3：加后台任务（celery 发邮件）¶

方向三：自动化运维 / 脚本 / 工具¶

为什么选这个方向¶

必备库清单¶

三个起点项目¶

项目 1：网页变化监控 + 钉钉/飞书通知¶

项目 2：自动备份目录到 OSS / S3¶

项目 3：交互式 TUI 应用（rich + textual）¶

横向技能：三个方向都要会的东西¶

怎么挑方向¶

持续学习：往下走的资源¶

结尾的话¶

项目 1：用 `pandas` 分析一份公开数据集¶

项目 2：用 `transformers` 跑一个本地分类模型¶