学完之后做什么:Python 的三条出路¶
各位老朋友——
能读到这一章,水哥先恭喜你。
从 python0 一路走到 python27,咱们一起聊过变量、函数、面向对象、异常、文件、模块、虚拟环境、类型注解、pathlib、dataclass 与 Pydantic、上下文管理器、async/await + httpx、pyproject.toml、uv、pytest、Git 协同、CI/CD、PyPI 发包……整整二十八章,几十万字,几百段代码。各位走到这里,已经不是「只会写 print('hello')」的初学者了,而是一个能从零搭项目、能写测试、能发包、能跟团队协作的、真正意义上的 Python 工程师。
可是各位有没有发现一件事——读完这二十八章,会的东西看起来很多,可一旦关上书,又好像不知道接下来该写点啥?
这种感觉水哥太懂了。Python 的语法和工程化只是地基,地基打好了之后,往上面盖什么样的房子,得各位自己挑。Python 的世界很大——大到一辈子也学不完。但是大归大,主流方向其实就那么几个,挑一个跟着做,比漫无目的地刷教程强一百倍。
这一章水哥不教语法、不写大段代码,就给各位三个最主流的 Python 出路:
- 数据 / AI / 机器学习——2026 年最火的方向,Python 是 AI 的母语
- Web 后端开发——开发效率高、能见度高、招聘面广
- 自动化运维 / 脚本 / 工具——把日常工作变成代码,Python 当年就是靠这个起家的
每个方向水哥会讲三件事:为什么选它、必备库清单、三个起点项目。挑一个最对你胃口的,把项目跟着撸完,比读十本书都顶用。
走起。
方向一:数据 / AI / 机器学习¶
为什么选这个方向¶
各位翻一翻 2026 年的招聘网站,搜「Python 工程师」三个字,跳出来的岗位大半带着「数据」、「算法」、「AI」、「LLM」、「大模型」、「机器学习」这些词。这不是巧合——Python 是 AI 时代事实上的母语。
为啥?水哥给各位讲三层原因——
第一层是生态。从 2010 年代初的 numpy/pandas,到 2015 年的 scikit-learn,到 2017 年的 tensorflow/pytorch,到 2022 年之后 transformers/langchain/openai/anthropic 各种 SDK,二十年下来,AI 圈所有重要的库第一个版本都是 Python 写的。其他语言不是不能用,是用了之后发现「跟主流社区接不上」——别人发论文用 PyTorch,你用 Julia 或者 Rust 重写一遍,论文复现都没人跟你聊。
第二层是节奏。AI 圈是一个「论文今天发,明天就有人开源代码」的圈子。这种节奏下,能一行 pip install 装上的 Python 库,比要编译半小时的 C++/Rust 库快一万倍。语言性能不是不重要,而是先跑通、再优化这个顺序在 AI 圈被压得特别极端,Python 正好是「先跑通」这一步的最优解。
第三层是钱。2026 年的 AI 工程师薪资在所有 Python 方向里最高——一线城市资深岗位 50k-80k 不算稀奇,应届生只要能讲清楚一两个 LLM 项目,起薪 30k 也很常见。这里水哥不是劝各位「为钱学 AI」,而是说——AI 方向的市场需求、薪资上限、想象空间都摆在那儿,往这个方向走的回报曲线很陡。
所以——如果各位对「让机器自己学」、「让模型替我写代码」、「让程序看图说话」这些话题感兴趣,AI 这条路水哥推荐你认真看一眼。
必备库清单¶
数据/AI 方向的库分四个层次,从下往上——
| 层次 | 代表库 | 干啥用的 |
|---|---|---|
| 数据基础 | numpy、pandas、matplotlib、jupyter |
数组、表格、画图、交互式笔记本,俗称「数据四件套」 |
| 数据增强 | polars、seaborn、plotly |
pandas 的 Rust 升级版、统计图美化、交互图 |
| 传统 ML | scikit-learn、xgboost、lightgbm |
分类、回归、聚类、决策树、梯度提升 |
| 深度学习 | pytorch、transformers、huggingface_hub |
神经网络框架、预训练模型一行加载 |
| LLM 应用 | anthropic、openai、langchain、llama-index |
调商业 LLM、做 RAG、做 Agent |
各位看完这张表估计有点懵——「学这么多?」别慌,这张表是地图,不是清单。地图给你看「这个方向有啥风景」,真正学的时候按下面的路径来——
- 基础四件套先打通:
numpy算数组、pandas处理表格、matplotlib画图、jupyter当画板。这四个库吃透,70% 的数据分析任务都能干。 scikit-learn是传统 ML 的入口:决策树、随机森林、SVM、KMeans 这些经典算法都在里面,API 极其统一——fit训练、predict预测,三行代码跑一个模型。transformers是深度学习的捷径:HuggingFace 把所有主流预训练模型(BERT、GPT-2、Llama、Qwen)打包成统一接口,一行pipeline('sentiment-analysis')就能跑情感分析。各位不用从 PyTorch 开始啃,直接用预训练模型干活,遇到瓶颈再往下钻。- LLM SDK 是 2026 年的新基建:
anthropic调 Claude、openai调 GPT,加上langchain做编排、llama-index做 RAG,这套组合是当前「LLM 应用工程师」这个新岗位的标配。
「polars 凭啥能挑战 pandas?」这个问题水哥多说一句——polars 是 Rust 写的 DataFrame 库,速度比 pandas 快 5-10 倍,API 更现代(强类型、惰性求值、不容易写错)。2024 年之后越来越多新项目首选 polars。但是 pandas 生态太成熟、教程太多,入门还是建议从 pandas 开始,等你写多了 pandas 觉得「这语法真烦」的时候,自然就会去看 polars。
三个起点项目¶
项目 1:用 pandas 分析一份公开数据集¶
- 做什么:从 Kaggle 下载一份 CSV(推荐 Titanic 或者 TMDB Movies),在
jupyter里读进来,做 5 个分析:缺失值统计、分布直方图、相关性热力图、分组聚合、画一张能讲故事的图 - 难度:★☆☆☆☆
- 代码量:100-200 行
- 学到啥:
pandas的read_csv/groupby/merge/pivot_table全套基础操作;matplotlib和seaborn画图;用jupyter写「能给别人看」的分析报告
这个项目水哥强烈建议各位第一个就做。它不光教 pandas,还培养一个 AI 工程师必备的习惯——面对一份陌生数据,第一反应是去看分布、看缺失、看异常值,而不是闷头写模型。
项目 2:用 transformers 跑一个本地分类模型¶
- 做什么:用 HuggingFace 的
pipeline('sentiment-analysis')做一个「电影评论好坏判断器」。先用预训练模型直接跑,再下载 IMDB 评论数据集做微调(fine-tune),把准确率从 85% 提到 92% - 难度:★★★☆☆
- 代码量:200-400 行
- 学到啥:
transformers的pipeline用法、HuggingFace Hub 怎么找模型、TrainerAPI 微调流程、GPU 和 CPU 切换、模型保存和加载
「我没显卡咋办?」用 Google Colab。免费给 T4 GPU,跑这种小模型够用。或者用 Apple Silicon 的 MPS 后端,M 系列芯片本地训练也能跑。
项目 3:调 Claude API 写一个「PDF 总结」工具¶
- 做什么:写一个命令行工具,输入一个 PDF 路径,输出一份 200 字的中文总结。流程是——
pypdf抽文字 → 切成 2000 字一段 → 每段调anthropicSDK 让 Claude 总结 → 最后再让 Claude 把所有片段总结汇总成一份 - 难度:★★☆☆☆
- 代码量:100-200 行
- 学到啥:
anthropicSDK 用法、API key 管理(.env+python-dotenv)、长文本切分策略、prompt engineering入门、流式输出
这个项目跟 2026 年的工作场景贴得最近。各位在公司里写一个这种工具,立马能解决「每周看 5 篇行业报告」的痛点,老板看了都想给你加薪。
方向二:Web 后端开发¶
为什么选这个方向¶
「Web 后端」听起来很老,2026 年还有人写吗?
有,而且特别多。原因很简单——所有公司都需要 API。前端框架换了一茬又一茬(Vue、React、Svelte),App 端从原生到混合到跨平台,但是后端始终在那儿,吭哧吭哧地处理请求、读数据库、调外部服务、返回 JSON。
Web 后端不会消失,只会变得更重要——因为:
- AI 应用本质上是 Web 应用。各位看 ChatGPT、Claude、Cursor,前端是个聊天框,后端就是一堆 API 在调模型。LLM 工程师 90% 的工作其实是写后端,只不过加了一个「调模型」的环节。
- 微服务还在普及。一个公司一个大应用变成几十个小服务,每个服务都是一个 Web 后端项目。Python 在这种小服务场景下开发效率非常高。
- 招聘面最广。各位投简历搜「Python 后端」,全国一线城市每天新挂的岗位都是几百个起步——比 AI 岗位多,门槛也低一点。
那 Python 写后端跟 Java、Go、Node 比有啥优势?水哥说三点——
- 开发速度快:写一个 CRUD API,Python 大概 100 行,Java 同样的功能至少 300 行
- 跟 AI 生态无缝衔接:后端里要塞一段「调 LLM 处理用户输入」的逻辑,Python 一行 import 就完事
- 2024 年之后 Python 后端的工程化追上来了:
fastapi+pydantic+sqlmodel+uv这套现代栈,类型安全、文档自动生成、性能也跟得上,跟 Go 比不再被吊打
必备库清单¶
| 角色 | 代表库 | 干啥用的 |
|---|---|---|
| Web 框架 | fastapi、starlette |
写 API,主流首选 |
| 数据校验 | pydantic |
请求体、响应体的类型校验,跟 fastapi 深度集成 |
| ASGI 服务器 | uvicorn、hypercorn、granian |
跑 fastapi 的服务器,生产环境一般是 uvicorn + gunicorn |
| ORM | sqlalchemy 2.x、sqlmodel |
操作数据库,sqlmodel 是 fastapi 作者写的 SQLAlchemy 简化版 |
| 数据库迁移 | alembic |
表结构变更管理,加一个字段、改一个类型 |
| 缓存 | redis-py、aiocache |
Redis 客户端、内存缓存 |
| 异步任务 | celery、dramatiq、arq |
后台跑邮件、爬虫、定时任务 |
| 认证 | python-jose、passlib、authlib |
JWT、密码哈希、OAuth |
| HTTP 客户端 | httpx |
调外部 API,同步异步都行 |
| 测试 | pytest、httpx.AsyncClient |
接口测试 |
「列了这么多咋下手?」从下往上分阶段——
- 第一阶段:单文件 API。装
fastapi和uvicorn,写一个 50 行的main.py跑起来,用浏览器打开http://localhost:8000/docs看自动生成的 Swagger 文档。这一步 30 分钟搞定,立马上瘾。 - 第二阶段:加数据库。装
sqlmodel,加一个 SQLite 数据库(不用单独装,Python 自带),写一组 CRUD 接口(增删改查)。这一步走通,你已经能写一个像样的 API 了。 - 第三阶段:加鉴权。装
python-jose和passlib,加一个/login接口发 JWT,加一个Depends(get_current_user)保护其他接口。这一步搞完,你的 API 就是「企业级」的了。 - 第四阶段:加异步任务。装
celery或者更轻量的dramatiq,把「发邮件」、「生成 PDF」这种耗时任务丢到后台跑。这一步进入「真生产」级别。
「Django 呢?」Django 5.x 在 2026 年仍然活得很好——它跟 fastapi 是两种哲学:
fastapi是「积木式」:从空白开始,需要啥装啥,适合 API、微服务、AI 后端django是「全家桶式」:Admin 后台、ORM、模板、表单、用户系统全自带,适合「一个团队从零做一个完整网站」这种场景
如果你以后想做内容站、电商、企业内部系统,Django 仍然是好选择。但如果你的目标是 AI 后端、微服务、移动 App 后端,fastapi 是 2026 年的默认答案。
三个起点项目¶
项目 1:todo API(CRUD + sqlmodel)¶
- 做什么:写一个待办事项 API,接口包括「创建 todo」、「列出所有 todo」、「按 ID 查 todo」、「更新 todo」、「删除 todo」。数据存 SQLite,用
sqlmodel做 ORM,用pytest写 5 个接口测试 - 难度:★☆☆☆☆
- 代码量:200-300 行
- 学到啥:
fastapi路由、pydantic模型、sqlmodelORM 的select/session.add/session.commit、pytest写接口测试、Swagger 文档怎么用
这个项目水哥建议所有想学 Web 后端的人都做一遍。它麻雀虽小,五脏俱全——做完之后,你会真切体会到「用 Python 写 API 真的快」这个事情。
项目 2:给 todo API 加 JWT 鉴权¶
- 做什么:在项目 1 的基础上加用户系统——加一张
User表、一个/register注册接口、一个/login登录接口(返回 JWT)、其他接口全部加Depends(get_current_user)保护起来。每个 todo 关联一个user_id,只能查/改自己的 - 难度:★★★☆☆
- 代码量:300-500 行
- 学到啥:JWT 的工作原理、
passlib怎么做密码哈希、fastapi的Depends依赖注入、关系型数据库的外键和 join、权限的「行级隔离」
JWT 是 2026 年 Web 后端最常考的概念。这一关过了之后,看任何后端项目都不慌。
项目 3:加后台任务(celery 发邮件)¶
- 做什么:在项目 2 的基础上加一个功能——用户注册之后给他发欢迎邮件,但是不阻塞 API 响应。装
celery+redis,把发邮件函数标成@app.task,注册接口里send_welcome_email.delay(user.email)一发就返回,邮件由 worker 在后台真去发 - 难度:★★★★☆
- 代码量:400-600 行
- 学到啥:消息队列的概念、
celery的 broker 和 backend、redis怎么当队列、worker 怎么部署、为啥要异步任务(用户体验、稳定性)
这个项目做完,你已经摸到了「分布式后端」的门。后面学 Kafka、学微服务,都是基于这个思路扩展出去的。
方向三:自动化运维 / 脚本 / 工具¶
为什么选这个方向¶
各位有没有听过 Python 的外号——「胶水语言」?
这个外号不是夸 Python 跑得快、不是夸 Python 类型安全、是夸 Python 「啥都能粘一下」。Python 的标准库巨大、第三方生态庞大、跟系统调用、跟 HTTP、跟数据库、跟文件、跟 Excel、跟 PDF、跟微信、跟钉钉……几乎所有「重复劳动」的场景,都能被 Python 做成一段脚本。
这个方向有几个特点——
- 见效快。一段 50 行的脚本,可能立马省掉每天半小时的重复劳动。各位写完之后自己用、自己爽,根本不用什么「上线」、「评审」、「灰度」。
- 不依赖大公司。AI 和后端方向更适合在公司里干(要数据、要服务器、要业务),自动化方向一台笔记本就能起飞。各位甚至可以靠这个接外包、做副业。
- 门槛最低,但天花板也不低。最简单的脚本初学者就能写,复杂一点的「分布式爬虫」、「企业内部自动化平台」、「DevOps 工具链」也是这个方向的延伸,资深岗位照样年薪百万。
如果各位的目标是「让自己每天的工作更轻松」,或者「想做一些能马上看到效果的小项目」,自动化方向是性价比最高的选择。
必备库清单¶
| 用途 | 代表库 | 干啥用的 |
|---|---|---|
| HTTP 请求 | requests、httpx |
调 API、爬网页,httpx 支持异步 |
| 网页抓取 | beautifulsoup4、lxml、playwright、selenium |
解析 HTML、自动控制浏览器 |
| 定时任务 | schedule、apscheduler |
每天 9 点跑一次、每隔 5 分钟跑一次 |
| 远程操作 | paramiko、fabric |
SSH 到服务器执行命令 |
| 终端 UI | rich、textual |
彩色输出、表格、进度条、TUI 应用 |
| CLI 框架 | click、typer |
写命令行工具,参数解析比 argparse 优雅十倍 |
| 配置文件 | pyyaml、tomllib、configparser |
YAML、TOML、INI 解析 |
| 文件操作 | pathlib、shutil、watchdog |
路径操作(标准库)、文件监听 |
| 办公自动化 | openpyxl、python-docx、pypdf |
Excel、Word、PDF |
| 通知 | webhook(钉钉/飞书/Slack) | 出事了发消息 |
「这一坨咋学?」自动化方向不要按照清单学,按项目学。各位脑子里有一个「我每天/每周做的某件麻烦事」,然后用上面的库去做掉它,需要啥学啥,半年下来这个清单自然就熟了。
rich 这个库水哥必须单独夸一句。它是 Will McGugan 写的,让 Python 终端输出变彩色、变带格式,进度条、表格、Markdown 渲染、错误堆栈高亮全部内置。装了它之后,各位写的命令行工具立马「像样」了一个量级。textual 是同一个作者搞的 TUI 框架——在终端里搞出一个响应式应用,跟 Web 一样的组件化思路,可玩性极高。
三个起点项目¶
项目 1:网页变化监控 + 钉钉/飞书通知¶
- 做什么:监控某个网页(比如「某商品 SKU 的价格」、「某博客作者的最新文章」、「12306 的某条火车票余票」),每 10 分钟抓一次,发现变化就发钉钉/飞书 webhook 通知到群里。脚本用
apscheduler调度,HTTP 用httpx,HTML 解析用beautifulsoup4 - 难度:★★☆☆☆
- 代码量:100-200 行
- 学到啥:HTTP GET、HTML 解析(CSS selector)、状态对比(hash 比对、diff 比对)、定时任务、webhook 怎么发
这个项目水哥自己写过好几个版本——监控博客订阅、监控演唱会票务、监控购物网站降价,都是它的变种。做完一个之后,每次想监控啥东西改两行就能新开一个,复用率超高。
项目 2:自动备份目录到 OSS / S3¶
- 做什么:写一个脚本,每天凌晨 2 点把指定目录(比如
~/Documents/重要资料)打成 zip,按日期命名(backup-2026-04-28.zip),上传到阿里云 OSS 或者 AWS S3,再删除超过 30 天的旧备份。脚本用apscheduler调度,压缩用标准库zipfile,上传用oss2或boto3 - 难度:★★★☆☆
- 代码量:200-300 行
- 学到啥:文件遍历(
pathlib)、zip 压缩、对象存储 SDK 用法、密钥管理(.env)、生命周期管理(按日期清理)、日志(logging)
「这有啥用?」各位平时电脑里的代码、笔记、设计稿,是不是哪天硬盘坏了就全没了?这种自动备份脚本写一次,用十年。水哥的 Mac 上现在还跑着一个 2018 年写的备份脚本,从来没改过。
项目 3:交互式 TUI 应用(rich + textual)¶
- 做什么:用
textual写一个终端版的 todo 应用——左侧列表显示所有 todo、右侧详情可编辑、底部状态栏显示统计、按n新建、按d删除、按e编辑。数据存本地 JSON 文件 - 难度:★★★★☆
- 代码量:300-500 行
- 学到啥:
textual的组件、布局、事件、CSS 样式(对,TUI 也用 CSS)、键盘快捷键绑定、应用状态管理
这个项目难度稍高,但是做完之后你会发现——「原来终端里也能写出像 VSCode 一样的应用」。这种成就感是其他项目给不了的。水哥当年写完第一个 textual 应用,激动得发了个朋友圈。
横向技能:三个方向都要会的东西¶
不管各位最后挑哪个方向,下面这几样横向技能都要懂——它们是 2026 年所有 Python 工程师的「通用底盘」:
- Git:除了
add/commit/push,还要会branch/merge/rebase/cherry-pick,看得懂git log --graph。python25那一章已经聊过,回头再翻一遍。 - Docker:把自己的 Python 项目装进容器,写一个
Dockerfile,跑docker compose up把应用 + 数据库 + 缓存一把启动。后端方向尤其要会。 - Linux 基础:
ssh/cd/ls/grep/awk/tail -f/ps/top/systemctl,会用vim改个配置文件。运维方向必须会,其他方向也得懂个皮毛。 - SQL 基础:
SELECT/JOIN/GROUP BY/WHERE/INDEX。后端和数据方向必备,自动化方向偶尔也会用到。 - HTTP / REST 基本概念:GET / POST / PUT / DELETE、状态码、Cookie、JWT、CORS。三个方向都用得上。
这些不需要专门学,做项目的时候遇到了再补,半年下来就熟了。重点是不要看到不熟的概念就绕开,每次都现学现用,知识自然就长上身了。
怎么挑方向¶
各位读到这里,估计心里在打鼓——「到底选哪个?」
水哥给一个简单的判断标准——
- 想看 LLM 浪潮、对「让机器思考」着迷 → 选数据 / AI
- 想做能见度高的产品、喜欢看到成果跑在网上 → 选Web 后端
- 想立刻减轻自己当下的工作量、爱折腾日常工具 → 选自动化
或者更简单——哪个方向的「起点项目」让你看完想立刻动手,就选哪个。这种「想动手」的冲动,是最准的内心指南针。
「能不能混搭?」当然能。水哥自己就是「自动化 + AI」的混搭——日常用 Python 写小工具,工具里塞 LLM 调用,每个工具都比纯写脚本聪明十倍。三个方向之间没有壁垒,只要语法和工程化的地基稳,从哪条路都能走到尽头。
但是起步阶段水哥建议各位「专一」——选一个方向做半年,把上面三个项目都撸完,再考虑横向扩张。一开始三个方向同时学,结果就是三个方向都半瓶水,啥都拿不出手。
持续学习:往下走的资源¶
学到这里,各位已经从「教程读者」毕业了,接下来要自己进社区。水哥推荐这几个长期跟着的频道——
- Real Python:英文社区里最优质的 Python 教程站,从基础到高级都有,每周更新两三篇深度文章
- Talk Python To Me:Michael Kennedy 主持的播客,每集请一位社区名人聊一个主题,通勤的时候听
- PyCon 系列演讲:YouTube 上免费看,每年 PyCon US / EU / China 都有几百个高质量演讲,挑感兴趣的看
- Python Weekly:每周一封邮件,帮你过滤一周里值得看的 Python 新闻、库、项目
- 每年 10 月 Python 新版本发布:去 What's New in Python 看一眼新版本添了什么,跟着版本走
中文圈的话,水哥会继续在 walter201230/Python 这个仓库里更新——欢迎各位 star、watch、提 issue 提 PR。教程是死的,社区是活的,能跟一群人一起进步,比一个人闷头啃书强一万倍。
结尾的话¶
各位老朋友——
写到这里,水哥忍不住要回到 python0 那一章的开头——「学习 Python 需要一步一个脚印,踏踏实实地学。」
这句话水哥当年写下的时候,自己都没想到会陪伴各位走完二十八章。一步一个脚印,听着像废话,但是落到每一天——每天写 50 行代码、每天读一篇文档、每天 commit 一次——半年下来就是质变。水哥自己学 Python 也是这么过来的,没啥诀窍。
学完 python28,各位手里已经有了一整套Python 工程师的工具箱——语法、生态、工程化、协作流程,外加一张「下一站去哪」的地图。怎么用这套工具箱,盖出怎样的房子,从今往后是各位自己的事了。
最后水哥送给所有读到这里的老朋友三句话——
- 挑一个方向,做三个项目,把它们传到 GitHub。这比读一百本书都有用。
- 遇到搞不懂的报错先去 Google,再去 Stack Overflow,最后去问 Claude。每一次 debug 都是一次成长。
- 不要停。Python 在变、AI 在变、整个行业每天都在变。保持好奇心,保持动手习惯,五年之后,各位回头看 2026 年的自己,会感谢今天没有停下来的你。
祝各位前程似锦,代码常青。
我们下次再见。
—— 水哥 2026 年 4 月