跳转至

学完之后做什么:Python 的三条出路

各位老朋友——

能读到这一章,水哥先恭喜你。

python0 一路走到 python27,咱们一起聊过变量、函数、面向对象、异常、文件、模块、虚拟环境、类型注解、pathlibdataclassPydantic、上下文管理器、async/await + httpxpyproject.tomluvpytest、Git 协同、CI/CD、PyPI 发包……整整二十八章,几十万字,几百段代码。各位走到这里,已经不是「只会写 print('hello')」的初学者了,而是一个能从零搭项目、能写测试、能发包、能跟团队协作的、真正意义上的 Python 工程师。

可是各位有没有发现一件事——读完这二十八章,会的东西看起来很多,可一旦关上书,又好像不知道接下来该写点啥

这种感觉水哥太懂了。Python 的语法和工程化只是地基,地基打好了之后,往上面盖什么样的房子,得各位自己挑。Python 的世界很大——大到一辈子也学不完。但是大归大,主流方向其实就那么几个,挑一个跟着做,比漫无目的地刷教程强一百倍。

这一章水哥不教语法、不写大段代码,就给各位三个最主流的 Python 出路:

  1. 数据 / AI / 机器学习——2026 年最火的方向,Python 是 AI 的母语
  2. Web 后端开发——开发效率高、能见度高、招聘面广
  3. 自动化运维 / 脚本 / 工具——把日常工作变成代码,Python 当年就是靠这个起家的

每个方向水哥会讲三件事:为什么选它、必备库清单、三个起点项目。挑一个最对你胃口的,把项目跟着撸完,比读十本书都顶用。

走起。

方向一:数据 / AI / 机器学习

为什么选这个方向

各位翻一翻 2026 年的招聘网站,搜「Python 工程师」三个字,跳出来的岗位大半带着「数据」、「算法」、「AI」、「LLM」、「大模型」、「机器学习」这些词。这不是巧合——Python 是 AI 时代事实上的母语

为啥?水哥给各位讲三层原因——

第一层是生态。从 2010 年代初的 numpy/pandas,到 2015 年的 scikit-learn,到 2017 年的 tensorflow/pytorch,到 2022 年之后 transformers/langchain/openai/anthropic 各种 SDK,二十年下来,AI 圈所有重要的库第一个版本都是 Python 写的。其他语言不是不能用,是用了之后发现「跟主流社区接不上」——别人发论文用 PyTorch,你用 Julia 或者 Rust 重写一遍,论文复现都没人跟你聊。

第二层是节奏。AI 圈是一个「论文今天发,明天就有人开源代码」的圈子。这种节奏下,能一行 pip install 装上的 Python 库,比要编译半小时的 C++/Rust 库快一万倍。语言性能不是不重要,而是先跑通、再优化这个顺序在 AI 圈被压得特别极端,Python 正好是「先跑通」这一步的最优解。

第三层是。2026 年的 AI 工程师薪资在所有 Python 方向里最高——一线城市资深岗位 50k-80k 不算稀奇,应届生只要能讲清楚一两个 LLM 项目,起薪 30k 也很常见。这里水哥不是劝各位「为钱学 AI」,而是说——AI 方向的市场需求、薪资上限、想象空间都摆在那儿,往这个方向走的回报曲线很陡。

所以——如果各位对「让机器自己学」、「让模型替我写代码」、「让程序看图说话」这些话题感兴趣,AI 这条路水哥推荐你认真看一眼。

必备库清单

数据/AI 方向的库分四个层次,从下往上——

层次 代表库 干啥用的
数据基础 numpypandasmatplotlibjupyter 数组、表格、画图、交互式笔记本,俗称「数据四件套」
数据增强 polarsseabornplotly pandas 的 Rust 升级版、统计图美化、交互图
传统 ML scikit-learnxgboostlightgbm 分类、回归、聚类、决策树、梯度提升
深度学习 pytorchtransformershuggingface_hub 神经网络框架、预训练模型一行加载
LLM 应用 anthropicopenailangchainllama-index 调商业 LLM、做 RAG、做 Agent

各位看完这张表估计有点懵——「学这么多?」别慌,这张表是地图,不是清单。地图给你看「这个方向有啥风景」,真正学的时候按下面的路径来——

  1. 基础四件套先打通numpy 算数组、pandas 处理表格、matplotlib 画图、jupyter 当画板。这四个库吃透,70% 的数据分析任务都能干。
  2. scikit-learn 是传统 ML 的入口:决策树、随机森林、SVM、KMeans 这些经典算法都在里面,API 极其统一——fit 训练、predict 预测,三行代码跑一个模型。
  3. transformers 是深度学习的捷径:HuggingFace 把所有主流预训练模型(BERT、GPT-2、Llama、Qwen)打包成统一接口,一行 pipeline('sentiment-analysis') 就能跑情感分析。各位不用从 PyTorch 开始啃,直接用预训练模型干活,遇到瓶颈再往下钻。
  4. LLM SDK 是 2026 年的新基建anthropic 调 Claude、openai 调 GPT,加上 langchain 做编排、llama-index 做 RAG,这套组合是当前「LLM 应用工程师」这个新岗位的标配。

polars 凭啥能挑战 pandas?」这个问题水哥多说一句——polars 是 Rust 写的 DataFrame 库,速度比 pandas 快 5-10 倍,API 更现代(强类型、惰性求值、不容易写错)。2024 年之后越来越多新项目首选 polars。但是 pandas 生态太成熟、教程太多,入门还是建议从 pandas 开始,等你写多了 pandas 觉得「这语法真烦」的时候,自然就会去看 polars

三个起点项目

项目 1:用 pandas 分析一份公开数据集

  • 做什么:从 Kaggle 下载一份 CSV(推荐 Titanic 或者 TMDB Movies),在 jupyter 里读进来,做 5 个分析:缺失值统计、分布直方图、相关性热力图、分组聚合、画一张能讲故事的图
  • 难度:★☆☆☆☆
  • 代码量:100-200 行
  • 学到啥pandasread_csv/groupby/merge/pivot_table 全套基础操作;matplotlibseaborn 画图;用 jupyter 写「能给别人看」的分析报告

这个项目水哥强烈建议各位第一个就做。它不光教 pandas,还培养一个 AI 工程师必备的习惯——面对一份陌生数据,第一反应是去看分布、看缺失、看异常值,而不是闷头写模型。

项目 2:用 transformers 跑一个本地分类模型

  • 做什么:用 HuggingFace 的 pipeline('sentiment-analysis') 做一个「电影评论好坏判断器」。先用预训练模型直接跑,再下载 IMDB 评论数据集做微调(fine-tune),把准确率从 85% 提到 92%
  • 难度:★★★☆☆
  • 代码量:200-400 行
  • 学到啥transformerspipeline 用法、HuggingFace Hub 怎么找模型、Trainer API 微调流程、GPU 和 CPU 切换、模型保存和加载

「我没显卡咋办?」用 Google Colab。免费给 T4 GPU,跑这种小模型够用。或者用 Apple Silicon 的 MPS 后端,M 系列芯片本地训练也能跑。

项目 3:调 Claude API 写一个「PDF 总结」工具

  • 做什么:写一个命令行工具,输入一个 PDF 路径,输出一份 200 字的中文总结。流程是——pypdf 抽文字 → 切成 2000 字一段 → 每段调 anthropic SDK 让 Claude 总结 → 最后再让 Claude 把所有片段总结汇总成一份
  • 难度:★★☆☆☆
  • 代码量:100-200 行
  • 学到啥anthropic SDK 用法、API key 管理(.env + python-dotenv)、长文本切分策略、prompt engineering 入门、流式输出

这个项目跟 2026 年的工作场景贴得最近。各位在公司里写一个这种工具,立马能解决「每周看 5 篇行业报告」的痛点,老板看了都想给你加薪。

方向二:Web 后端开发

为什么选这个方向

「Web 后端」听起来很老,2026 年还有人写吗?

有,而且特别多。原因很简单——所有公司都需要 API。前端框架换了一茬又一茬(Vue、React、Svelte),App 端从原生到混合到跨平台,但是后端始终在那儿,吭哧吭哧地处理请求、读数据库、调外部服务、返回 JSON。

Web 后端不会消失,只会变得更重要——因为:

  1. AI 应用本质上是 Web 应用。各位看 ChatGPT、Claude、Cursor,前端是个聊天框,后端就是一堆 API 在调模型。LLM 工程师 90% 的工作其实是写后端,只不过加了一个「调模型」的环节。
  2. 微服务还在普及。一个公司一个大应用变成几十个小服务,每个服务都是一个 Web 后端项目。Python 在这种小服务场景下开发效率非常高。
  3. 招聘面最广。各位投简历搜「Python 后端」,全国一线城市每天新挂的岗位都是几百个起步——比 AI 岗位多,门槛也低一点。

那 Python 写后端跟 Java、Go、Node 比有啥优势?水哥说三点——

  • 开发速度快:写一个 CRUD API,Python 大概 100 行,Java 同样的功能至少 300 行
  • 跟 AI 生态无缝衔接:后端里要塞一段「调 LLM 处理用户输入」的逻辑,Python 一行 import 就完事
  • 2024 年之后 Python 后端的工程化追上来了fastapi + pydantic + sqlmodel + uv 这套现代栈,类型安全、文档自动生成、性能也跟得上,跟 Go 比不再被吊打

必备库清单

角色 代表库 干啥用的
Web 框架 fastapistarlette 写 API,主流首选
数据校验 pydantic 请求体、响应体的类型校验,跟 fastapi 深度集成
ASGI 服务器 uvicornhypercorngranian fastapi 的服务器,生产环境一般是 uvicorn + gunicorn
ORM sqlalchemy 2.xsqlmodel 操作数据库,sqlmodelfastapi 作者写的 SQLAlchemy 简化版
数据库迁移 alembic 表结构变更管理,加一个字段、改一个类型
缓存 redis-pyaiocache Redis 客户端、内存缓存
异步任务 celerydramatiqarq 后台跑邮件、爬虫、定时任务
认证 python-josepasslibauthlib JWT、密码哈希、OAuth
HTTP 客户端 httpx 调外部 API,同步异步都行
测试 pytesthttpx.AsyncClient 接口测试

「列了这么多咋下手?」从下往上分阶段——

  1. 第一阶段:单文件 API。装 fastapiuvicorn,写一个 50 行的 main.py 跑起来,用浏览器打开 http://localhost:8000/docs 看自动生成的 Swagger 文档。这一步 30 分钟搞定,立马上瘾。
  2. 第二阶段:加数据库。装 sqlmodel,加一个 SQLite 数据库(不用单独装,Python 自带),写一组 CRUD 接口(增删改查)。这一步走通,你已经能写一个像样的 API 了。
  3. 第三阶段:加鉴权。装 python-josepasslib,加一个 /login 接口发 JWT,加一个 Depends(get_current_user) 保护其他接口。这一步搞完,你的 API 就是「企业级」的了。
  4. 第四阶段:加异步任务。装 celery 或者更轻量的 dramatiq,把「发邮件」、「生成 PDF」这种耗时任务丢到后台跑。这一步进入「真生产」级别。

「Django 呢?」Django 5.x 在 2026 年仍然活得很好——它跟 fastapi 是两种哲学:

  • fastapi 是「积木式」:从空白开始,需要啥装啥,适合 API、微服务、AI 后端
  • django 是「全家桶式」:Admin 后台、ORM、模板、表单、用户系统全自带,适合「一个团队从零做一个完整网站」这种场景

如果你以后想做内容站、电商、企业内部系统,Django 仍然是好选择。但如果你的目标是 AI 后端、微服务、移动 App 后端,fastapi 是 2026 年的默认答案。

三个起点项目

项目 1:todo API(CRUD + sqlmodel)

  • 做什么:写一个待办事项 API,接口包括「创建 todo」、「列出所有 todo」、「按 ID 查 todo」、「更新 todo」、「删除 todo」。数据存 SQLite,用 sqlmodel 做 ORM,用 pytest 写 5 个接口测试
  • 难度:★☆☆☆☆
  • 代码量:200-300 行
  • 学到啥fastapi 路由、pydantic 模型、sqlmodel ORM 的 select/session.add/session.commitpytest 写接口测试、Swagger 文档怎么用

这个项目水哥建议所有想学 Web 后端的人都做一遍。它麻雀虽小,五脏俱全——做完之后,你会真切体会到「用 Python 写 API 真的快」这个事情。

项目 2:给 todo API 加 JWT 鉴权

  • 做什么:在项目 1 的基础上加用户系统——加一张 User 表、一个 /register 注册接口、一个 /login 登录接口(返回 JWT)、其他接口全部加 Depends(get_current_user) 保护起来。每个 todo 关联一个 user_id,只能查/改自己的
  • 难度:★★★☆☆
  • 代码量:300-500 行
  • 学到啥:JWT 的工作原理、passlib 怎么做密码哈希、fastapiDepends 依赖注入、关系型数据库的外键和 join、权限的「行级隔离」

JWT 是 2026 年 Web 后端最常考的概念。这一关过了之后,看任何后端项目都不慌。

项目 3:加后台任务(celery 发邮件)

  • 做什么:在项目 2 的基础上加一个功能——用户注册之后给他发欢迎邮件,但是不阻塞 API 响应。装 celery + redis,把发邮件函数标成 @app.task,注册接口里 send_welcome_email.delay(user.email) 一发就返回,邮件由 worker 在后台真去发
  • 难度:★★★★☆
  • 代码量:400-600 行
  • 学到啥:消息队列的概念、celery 的 broker 和 backend、redis 怎么当队列、worker 怎么部署、为啥要异步任务(用户体验、稳定性)

这个项目做完,你已经摸到了「分布式后端」的门。后面学 Kafka、学微服务,都是基于这个思路扩展出去的。

方向三:自动化运维 / 脚本 / 工具

为什么选这个方向

各位有没有听过 Python 的外号——「胶水语言」

这个外号不是夸 Python 跑得快、不是夸 Python 类型安全、是夸 Python 「啥都能粘一下」。Python 的标准库巨大、第三方生态庞大、跟系统调用、跟 HTTP、跟数据库、跟文件、跟 Excel、跟 PDF、跟微信、跟钉钉……几乎所有「重复劳动」的场景,都能被 Python 做成一段脚本。

这个方向有几个特点——

  1. 见效快。一段 50 行的脚本,可能立马省掉每天半小时的重复劳动。各位写完之后自己用、自己爽,根本不用什么「上线」、「评审」、「灰度」。
  2. 不依赖大公司。AI 和后端方向更适合在公司里干(要数据、要服务器、要业务),自动化方向一台笔记本就能起飞。各位甚至可以靠这个接外包、做副业。
  3. 门槛最低,但天花板也不低。最简单的脚本初学者就能写,复杂一点的「分布式爬虫」、「企业内部自动化平台」、「DevOps 工具链」也是这个方向的延伸,资深岗位照样年薪百万。

如果各位的目标是「让自己每天的工作更轻松」,或者「想做一些能马上看到效果的小项目」,自动化方向是性价比最高的选择。

必备库清单

用途 代表库 干啥用的
HTTP 请求 requestshttpx 调 API、爬网页,httpx 支持异步
网页抓取 beautifulsoup4lxmlplaywrightselenium 解析 HTML、自动控制浏览器
定时任务 scheduleapscheduler 每天 9 点跑一次、每隔 5 分钟跑一次
远程操作 paramikofabric SSH 到服务器执行命令
终端 UI richtextual 彩色输出、表格、进度条、TUI 应用
CLI 框架 clicktyper 写命令行工具,参数解析比 argparse 优雅十倍
配置文件 pyyamltomllibconfigparser YAML、TOML、INI 解析
文件操作 pathlibshutilwatchdog 路径操作(标准库)、文件监听
办公自动化 openpyxlpython-docxpypdf Excel、Word、PDF
通知 webhook(钉钉/飞书/Slack) 出事了发消息

「这一坨咋学?」自动化方向不要按照清单学,按项目学。各位脑子里有一个「我每天/每周做的某件麻烦事」,然后用上面的库去做掉它,需要啥学啥,半年下来这个清单自然就熟了。

rich 这个库水哥必须单独夸一句。它是 Will McGugan 写的,让 Python 终端输出变彩色、变带格式,进度条、表格、Markdown 渲染、错误堆栈高亮全部内置。装了它之后,各位写的命令行工具立马「像样」了一个量级。textual 是同一个作者搞的 TUI 框架——在终端里搞出一个响应式应用,跟 Web 一样的组件化思路,可玩性极高。

三个起点项目

项目 1:网页变化监控 + 钉钉/飞书通知

  • 做什么:监控某个网页(比如「某商品 SKU 的价格」、「某博客作者的最新文章」、「12306 的某条火车票余票」),每 10 分钟抓一次,发现变化就发钉钉/飞书 webhook 通知到群里。脚本用 apscheduler 调度,HTTP 用 httpx,HTML 解析用 beautifulsoup4
  • 难度:★★☆☆☆
  • 代码量:100-200 行
  • 学到啥:HTTP GET、HTML 解析(CSS selector)、状态对比(hash 比对、diff 比对)、定时任务、webhook 怎么发

这个项目水哥自己写过好几个版本——监控博客订阅、监控演唱会票务、监控购物网站降价,都是它的变种。做完一个之后,每次想监控啥东西改两行就能新开一个,复用率超高。

项目 2:自动备份目录到 OSS / S3

  • 做什么:写一个脚本,每天凌晨 2 点把指定目录(比如 ~/Documents/重要资料)打成 zip,按日期命名(backup-2026-04-28.zip),上传到阿里云 OSS 或者 AWS S3,再删除超过 30 天的旧备份。脚本用 apscheduler 调度,压缩用标准库 zipfile,上传用 oss2boto3
  • 难度:★★★☆☆
  • 代码量:200-300 行
  • 学到啥:文件遍历(pathlib)、zip 压缩、对象存储 SDK 用法、密钥管理(.env)、生命周期管理(按日期清理)、日志(logging

「这有啥用?」各位平时电脑里的代码、笔记、设计稿,是不是哪天硬盘坏了就全没了?这种自动备份脚本写一次,用十年。水哥的 Mac 上现在还跑着一个 2018 年写的备份脚本,从来没改过。

项目 3:交互式 TUI 应用(rich + textual)

  • 做什么:用 textual 写一个终端版的 todo 应用——左侧列表显示所有 todo、右侧详情可编辑、底部状态栏显示统计、按 n 新建、按 d 删除、按 e 编辑。数据存本地 JSON 文件
  • 难度:★★★★☆
  • 代码量:300-500 行
  • 学到啥textual 的组件、布局、事件、CSS 样式(对,TUI 也用 CSS)、键盘快捷键绑定、应用状态管理

这个项目难度稍高,但是做完之后你会发现——「原来终端里也能写出像 VSCode 一样的应用」。这种成就感是其他项目给不了的。水哥当年写完第一个 textual 应用,激动得发了个朋友圈。

横向技能:三个方向都要会的东西

不管各位最后挑哪个方向,下面这几样横向技能都要懂——它们是 2026 年所有 Python 工程师的「通用底盘」:

  • Git:除了 add / commit / push,还要会 branch / merge / rebase / cherry-pick,看得懂 git log --graphpython25 那一章已经聊过,回头再翻一遍。
  • Docker:把自己的 Python 项目装进容器,写一个 Dockerfile,跑 docker compose up 把应用 + 数据库 + 缓存一把启动。后端方向尤其要会。
  • Linux 基础ssh / cd / ls / grep / awk / tail -f / ps / top / systemctl,会用 vim 改个配置文件。运维方向必须会,其他方向也得懂个皮毛。
  • SQL 基础SELECT / JOIN / GROUP BY / WHERE / INDEX。后端和数据方向必备,自动化方向偶尔也会用到。
  • HTTP / REST 基本概念:GET / POST / PUT / DELETE、状态码、Cookie、JWT、CORS。三个方向都用得上。

这些不需要专门学,做项目的时候遇到了再补,半年下来就熟了。重点是不要看到不熟的概念就绕开,每次都现学现用,知识自然就长上身了。

怎么挑方向

各位读到这里,估计心里在打鼓——「到底选哪个?

水哥给一个简单的判断标准——

  • 想看 LLM 浪潮、对「让机器思考」着迷 → 选数据 / AI
  • 想做能见度高的产品、喜欢看到成果跑在网上 → 选Web 后端
  • 想立刻减轻自己当下的工作量、爱折腾日常工具 → 选自动化

或者更简单——哪个方向的「起点项目」让你看完想立刻动手,就选哪个。这种「想动手」的冲动,是最准的内心指南针。

「能不能混搭?」当然能。水哥自己就是「自动化 + AI」的混搭——日常用 Python 写小工具,工具里塞 LLM 调用,每个工具都比纯写脚本聪明十倍。三个方向之间没有壁垒,只要语法和工程化的地基稳,从哪条路都能走到尽头。

但是起步阶段水哥建议各位「专一」——选一个方向做半年,把上面三个项目都撸完,再考虑横向扩张。一开始三个方向同时学,结果就是三个方向都半瓶水,啥都拿不出手。

持续学习:往下走的资源

学到这里,各位已经从「教程读者」毕业了,接下来要自己进社区。水哥推荐这几个长期跟着的频道——

  • Real Python:英文社区里最优质的 Python 教程站,从基础到高级都有,每周更新两三篇深度文章
  • Talk Python To Me:Michael Kennedy 主持的播客,每集请一位社区名人聊一个主题,通勤的时候听
  • PyCon 系列演讲:YouTube 上免费看,每年 PyCon US / EU / China 都有几百个高质量演讲,挑感兴趣的看
  • Python Weekly:每周一封邮件,帮你过滤一周里值得看的 Python 新闻、库、项目
  • 每年 10 月 Python 新版本发布:去 What's New in Python 看一眼新版本添了什么,跟着版本走

中文圈的话,水哥会继续在 walter201230/Python 这个仓库里更新——欢迎各位 star、watch、提 issue 提 PR。教程是死的,社区是活的,能跟一群人一起进步,比一个人闷头啃书强一万倍。

结尾的话

各位老朋友——

写到这里,水哥忍不住要回到 python0 那一章的开头——「学习 Python 需要一步一个脚印,踏踏实实地学。

这句话水哥当年写下的时候,自己都没想到会陪伴各位走完二十八章。一步一个脚印,听着像废话,但是落到每一天——每天写 50 行代码、每天读一篇文档、每天 commit 一次——半年下来就是质变。水哥自己学 Python 也是这么过来的,没啥诀窍。

学完 python28,各位手里已经有了一整套Python 工程师的工具箱——语法、生态、工程化、协作流程,外加一张「下一站去哪」的地图。怎么用这套工具箱,盖出怎样的房子,从今往后是各位自己的事了。

最后水哥送给所有读到这里的老朋友三句话——

  1. 挑一个方向,做三个项目,把它们传到 GitHub。这比读一百本书都有用。
  2. 遇到搞不懂的报错先去 Google,再去 Stack Overflow,最后去问 Claude。每一次 debug 都是一次成长。
  3. 不要停。Python 在变、AI 在变、整个行业每天都在变。保持好奇心,保持动手习惯,五年之后,各位回头看 2026 年的自己,会感谢今天没有停下来的你。

祝各位前程似锦,代码常青。

我们下次再见。

—— 水哥 2026 年 4 月