HTML:让论文更易读、更无障碍
arXiv 正在为其超过 200 万篇论文推出 HTML 版本,旨在提升科研文献的 无障碍性。尽管从 LaTeX 到 HTML 的自动转换存在技术挑战和错误,但该项目强调 功能优先,并鼓励社区通过反馈来帮助改进,让论文内容更容易被辅助技术和移动设备访问。
提升科研文献的无障碍性
arXiv 的核心目标是通过提供 HTML 格式的论文,来解决科研领域的无障碍性问题。与现有的 PDF 相比,HTML 格式能更好地服务于有特殊需求的科研人员。
- 逐步覆盖: 我们正在逐步为 arXiv 超过 200 万篇论文的语料库生成 HTML 版本。
- 并非所有论文都可转换: 由于技术限制,一小部分论文可能无法成功转换。
- 方便访问: HTML 版本的链接将出现在摘要页面的 PDF 下载链接下方。
- 作者预览: 作者在提交论文的过程中将有机会预览其论文的 HTML 效果。
为什么是“实验性”的 HTML?
将论文转换为无障碍的 HTML 格式面临着独特的技术挑战,主要原因是 arXiv 上约 90% 的投稿都使用 TeX 格式(主要是 LaTeX)。将这种高度可扩展的语言准确、快速地自动转换为 HTML 非常复杂。
尽管存在转换和渲染问题的风险,我们决定以“实验性”的测试版先行推出,原因如下:
- 迫切的需求: 我们与社区,特别是与有无障碍需求的科研人员沟通后,他们强烈要求我们不要再等待。
- 需要社区帮助: 社区的反馈对于我们识别和定位那些因特定 LaTeX 宏包导致转换不正确的具体问题至关重要。
我们的首要目标是让论文更容易被访问,因此在测试阶段,我们将 功能优先于形式。
HTML 是一种与 PDF 不同的媒介,它自身也带有优势。除了与辅助技术的兼容性更好之外,HTML 还能更好地适应不同设备(包括移动设备)的屏幕特性。因此,请不要仅仅因为 HTML 论文看起来与 PDF 不完全一样就提交报告。我们预期 HTML 版本的换行、空白和排版会与 PDF 有所不同。
如何提供帮助?
社区的参与对该项目的成功至关重要。
1. 阅读 HTML 论文并报告问题
我们鼓励社区成员尝试阅读您所在领域的 HTML 论文,并通过以下方式报告问题:
- 点击论文页面上的 “Open Issue” 按钮。
- 选中特定文本,然后点击 “Open Issue for Selection” 按钮。
- 使用键盘快捷键 Ctrl+?。
2. 帮助改进从 LaTeX 的转换
不同角色的成员都可以为改善转换质量做出贡献:
- 作者: 遵循我们的 LaTeX 标记最佳实践指南,以确保您的论文能成功转换为 HTML。
- 开发者: LaTeXML 团队维护了一个公开的问题列表,欢迎开发者贡献代码和解决方案。
- 出版商与会议组织者: 审查并推荐使用受支持的软件包,可以极大地促进科学界内容的无障碍性。
最后,我们要特别感谢所有慷慨分享其见解、专业知识和指导的残障科学家,以及为该项目提供基础支持的 LaTeX 项目和 LaTeXML 团队。