了解DOM的HTML翻译器,用于以开发者为中心的本地化工作流程
doc-html-translate,由Serhii Zhyhunenko开发,自动化HTML本地化,以在语言转换过程中保持页面结构。该工具提取可见文本节点,将它们发送到翻译服务,如Google Translate,并在保持标记不变的情况下重新插入翻译后的字符串。它提供批处理、命令行配置和可供检查的开源代码库。旨在为网页开发人员和本地化专家服务,它减少了在脚本工作流中对静态HTML文件的手动编辑。
通过仅针对可翻译文本节点来保留文档结构
该工具解析HTML并替换人类可读字符串,而不是标记。它在标签内隔离文本内容,并将翻译后的字符串写回这些节点,同时保持标签名称、属性和嵌入脚本不变。这种行为保护DOM免受意外更改,并减少破坏布局或客户端代码的风险。典型的可翻译元素包括行内文本、标题和段落节点,而不是属性或CSS规则。
作为轻量级脚本运行,但需要运行时和网络访问
设计为桌面自动化的可脚本化工具。兼容性为Windows,工具需要Python运行时来执行翻译脚本。网络访问是强制性的,因为翻译是通过外部API进行的。小工具集和批处理的组合使其适合于自动构建或CI任务,其中已经存在Python环境和出站API访问。
对内容文件安全,但依赖外部服务获取结果
操作安全来自跳过功能代码和透明的源代码。该应用程序故意忽略CSS和JavaScript,以便功能资产保持不变,并且代码库在GitHub上公开,供审计或定制使用。由于翻译来自第三方服务,内容的准确性和可用性取决于这些API以及在运行期间的稳定网络连接。
需要命令行熟悉度,针对技术用户和集成管道
界面以命令行为中心,并通过参数可配置。通过CLI进行配置使得脚本批处理作业和集成到部署中变得简单,但这要求对命令语法和基本Python环境感到舒适。非技术用户可能需要一个包装器或GUI来直接使用;源代码可以在必要时进行调整以添加该层。
适合自动化网站本地化的团队的实用选择,具有明确的权衡
该工具奖励接受基于脚本的工作流程和外部翻译依赖的团队;它在自动化管道中为静态内容生成可重复的、代码安全的转换。它对远程翻译服务和命令行操作的依赖限制了在离线笔记本电脑或非技术人员使用时的应用。推荐。
赞成
- 仅翻译可读文本,保留 HTML 标签和脚本
- 批处理支持在脚本化工作流中处理多个HTML文件
- GitHub上的开源代码使审计和自定义修改成为可能
反对
- 需要活动的互联网访问才能使用翻译API
- 仅命令行,没有内置图形界面供普通用户使用
- 需要在 Windows 上安装 Python 运行时以运行脚本