你每天要处理多少次文本?
打开终端,复制一段日志。打开Excel,粘贴一堆数据。打开代码编辑器,格式化一团乱麻的JSON。
文本处理是程序员的日常基本功。但很多人还在手动一个个改。太慢了。
今天分享5个高频文本处理技巧,每个都配在线工具,打开浏览器就能用。
技巧一:批量去重,3秒搞定
场景:从服务器日志里提取独立IP,从用户列表里去掉重复邮箱,从API返回里筛出唯一字段。
手动去重?不存在的。
操作步骤:
- 打开 navbox.com.cn/tools/text-deduplicator/
- 把原始文本粘贴进去
- 选择"整行去重"或"部分匹配去重"
- 点击处理,结果直接复制
举个例子,你有1000行日志:
2026-06-01 GET /api/users 200
2026-06-01 POST /api/login 401
2026-06-01 GET /api/users 200
2026-06-01 GET /api/products 200
2026-06-01 POST /api/login 401
去重后只剩3行。简单粗暴,但非常管用。
进阶用法: 配合"保留首次出现"选项,可以确保数据顺序不被打乱。
技巧二:大小写一键转换
场景:API文档里的字段名大小写混乱。前端用camelCase,后端用snake_case,数据库用UPPER_CASE。对不齐就报错。
操作步骤:
- 打开 navbox.com.cn/tools/case-converter/
- 粘贴文本
- 选择目标格式:小写、大写、首字母大写、驼峰命名、帕斯卡命名、蛇形命名、kebab-case
- 一键转换
实测数据:10000行代码的大小写批量转换,耗时不到1秒。
实际案例:
一个REST API返回的字段是这样的:
userName, EmailAddress, phoneNumber, IsVerified
你要改成前端友好的驼峰命名:
userName, emailAddress, phoneNumber, isVerified
用case converter选"蛇形转驼峰",一次搞定。
技巧三:正则替换,告别Ctrl+F
场景:你有一堆URL需要加上https://前缀。或者要把所有的单引号改成双引号。或者要把日志里的时间戳统一格式。
Ctrl+F一个一个改?点到鼠标酸了。
操作步骤:
- 打开 navbox.com.cn/tools/text-replacer/
- 开启"正则匹配"模式
- 输入搜索模式和替换模式
- 预览结果,确认无误后复制
几个高频正则模板:
给所有URL加https://前缀:
- 搜索:
(https?://)?([^ ]+\.[^ ]+) - 替换:
https://$2
批量提取邮箱地址:
- 搜索:
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,} - 替换:(留空,只保留匹配项)
统一时间格式(ISO 8601):
- 搜索:
(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2}) - 替换:
$1-$2-$3T$4:$5:$6Z
技巧四:文本排序,不只是按字母
场景:把函数列表按首字母排好写文档。把错误日志按严重等级排序。把文件名按版本号排列。
操作步骤:
- 打开 navbox.com.cn/tools/text-sorter/
- 粘贴文本
- 选择排序方式:字母升序、字母降序、数字排序、倒序
- 得到结果
注意: 数字排序和普通字母排序结果完全不同。“10"在字母排序里会排在"2"前面,因为"1"的ASCII码更小。选"数字排序"才能正确排列。
实际案例:
一个版本号列表:
v1.10.0
v1.2.0
v1.9.0
v1.1.0
字母排序结果:
v1.1.0
v1.10.0
v1.2.0
v1.9.0
数字排序结果:
v1.1.0
v1.2.0
v1.9.0
v1.10.0
选对排序方式,结果天差地别。
技巧五:URL编码,让特殊字符安全传输
场景:你把一段包含中文、空格、特殊符号的文本放到URL参数里。结果服务器报400错误。
原因很简单:URL里不能直接出现中文和特殊字符。需要做URL编码。
操作步骤:
- 打开 navbox.com.cn/tools/url-encode-decode/
- 粘贴原始文本
- 点击编码,得到
%E4%B8%AD%E6%96%87这样的结果 - 需要还原时,粘贴编码结果点解码
高频场景:
- 搜索参数带中文关键词
- URL query string 传JSON数据
- 表单提交前的数据预处理
- API测试时构造请求参数
小贴士: 很多编程语言都有内置的URL编码方法。但在线工具的好处是即时可见,不用写代码就能验证编码结果对不对。
把这5个技巧串起来
真正的高手不会单独用某一个工具。他们会组合使用。
举个完整的工作流例子:
你接到一个任务——从API返回的JSON里提取所有用户邮箱,去重后按字母排序,最后生成一份邮件列表。
步骤:
- 用 JSON Path查询工具 提取email字段 → 得到一坨邮箱
- 用 文本去重工具 去掉重复邮箱
- 用 文本排序工具 按字母排序
- 复制到邮件客户端
全程不用写一行代码,全部在浏览器里完成。
写在最后
这5个技巧覆盖了90%的日常文本处理需求。
去重、大小写转换、正则替换、排序、URL编码。记住它们的名字,下次遇到类似问题,先想工具再动手。
你的文本处理痛点是什么?评论区聊聊。