《命令行上的数据科学第二版》校对活动重新启动

仓库:https://github.com/apachecn/ds-cmd-line-2e-zh

整体进度:https://github.com/apachecn/ds-cmd-line-2e-zh/issues/1

贡献指南:https://github.com/apachecn/ds-cmd-line-2e-zh/blob/master/CONTRIBUTING.md

章节列表:

  • 前言
  • 1 简介
  • 2 开始
  • 3 获取数据
  • 4 创建命令行工具
  • 5 清理数据
  • 6 项目管理与make
  • 7 探索数据
  • 8 并行管道
  • 9 建模数据
  • 10 多语言数据科学
  • 11 总结
  • 附录:命令行工具列表

贡献指南

请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)

负责人:

  • 飞龙:562826179

有用的链接

  • ApacheCN 文档导航
  • 谷歌翻译
  • ApacheCN 校对活动参与手册
  • 译后编辑
  • 当翻译竟然变成了文本编辑——李笑来
  • 翻译引擎易错术语列表(欢迎补充)
  • 廖雪峰 Git 教程

流程

一、认领

校对者需要熟练掌握 Markdown 和 Git,以及文档的主题(编程,Web开发,大数据,AI,安全之一)。

首先查看整体进度,确认没有人认领了你想认领的章节。

然后回复 ISSUE,注明“章节 + QQ 号”,便于联系和跟踪进度。

二、校对

需要校对【专业术语】和【格式】。

【语法】无需校对因为已经校对完了,并且请最大程度保留原文的语言风格。

译文在docs目录下,原文请见每个文章开头处的链接。

注意:不要修改译文的文件名,因为它们和章节对应!

确保译文符合下方的【Markdown 排版要求】一节。

请参考下方的【有用的正则表达式】一节,以及【翻译引擎易错术语列表】来提高效率。

三、提交

  • fork Github 项目
  • docs文件夹下编辑译文
  • addcommitpush
  • pull request

请见廖雪峰 Git 教程。

Markdown 排版要求

  1. 代码块和图片无需校对,并且不计入字数。
  2. 汉字和英文字母,汉字和数字之间空一格。但是中文标点和任何字符之间都不用空格。
  3. 粗体斜体和链接要求同上,中文和英文粗体,英文和中文粗体之间也需要空格。
  4. 任何编程语言中出现的东西,比如变量名,类名,函数名,包名,以及命令行中出现的东西,比如命令,文件名,路径,扩展名,都需要包在内联代码中。内联代码与汉字/标点之间无需空格,但和英文字母或数字之间空一格。
  5. 表格的格式容易乱,保证它们显示正常。
  6. 标题和较短的列表需要特别校对。
  7. 有少量未翻译的段落,使用谷歌翻译之后再校对。

有用的正则表达式

链接:

(?

表格:

^\|

中文间空格:

中文间空格一般是翻译引擎出错的地方。

[\u4e00-\u9fff]\s+[\u4e00-\u9fff]

未翻译段落:

^[a-zA-Z0-9][^\u4e00-\u9fff]+$
^\s*([\+\-\*]\x20{3}|\d+\.\x20{2})[^\u4e00-\u9fff]+$

内联代码:

在 Markdown 中,内联代码需要用反引号括起来,但一些教程并没有这样做。于是,需要检查中英文边界,将没有用反引号括起来的内联代码改掉。

[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]\x20*[A-Za-z0-9]|[A-Za-z0-9]\x20*[\u2018-\u201d\u3001-\u301c\u4e00-\u9fff\uff01-\uff65]

粗体/斜体:

\*\*[^\*]+\*\*|(?

标题:

^#+\x20

列表(二十字以内):

短的列表由于没有上下文非常容易出错。

^\s*([\+\-\*]\x20{3}|\d+\.\x20{2}).{1,20}$

奖励

校对者在完工后可以领取千字2~4元的奖励(视难度和工作量而定),请联系飞龙(Q562826179,V:wizardforcel)。

字数统计遵循 word 标准:每一个汉字和标点算一个字,一个连续的英文字母、数字和标点序列算一个字。

你可能感兴趣的:(《命令行上的数据科学第二版》校对活动重新启动)