HTML:让论文更易读、更无障碍

arXiv 正在为其超过 200 万篇论文推出 HTML 版本,旨在提升科研文献的 无障碍性。尽管从 LaTeX 到 HTML 的自动转换存在技术挑战和错误,但该项目强调 功能优先,并鼓励社区通过反馈来帮助改进,让论文内容更容易被辅助技术和移动设备访问。

提升科研文献的无障碍性

arXiv 的核心目标是通过提供 HTML 格式的论文,来解决科研领域的无障碍性问题。与现有的 PDF 相比,HTML 格式能更好地服务于有特殊需求的科研人员。

    • 逐步覆盖: 我们正在逐步为 arXiv 超过 200 万篇论文的语料库生成 HTML 版本。
    • 并非所有论文都可转换: 由于技术限制,一小部分论文可能无法成功转换。
    • 方便访问: HTML 版本的链接将出现在摘要页面的 PDF 下载链接下方。
    • 作者预览: 作者在提交论文的过程中将有机会预览其论文的 HTML 效果。

为什么是“实验性”的 HTML?

将论文转换为无障碍的 HTML 格式面临着独特的技术挑战,主要原因是 arXiv 上约 90% 的投稿都使用 TeX 格式(主要是 LaTeX)。将这种高度可扩展的语言准确、快速地自动转换为 HTML 非常复杂。

尽管存在转换和渲染问题的风险,我们决定以“实验性”的测试版先行推出,原因如下:

    • 迫切的需求: 我们与社区,特别是与有无障碍需求的科研人员沟通后,他们强烈要求我们不要再等待。
    • 需要社区帮助: 社区的反馈对于我们识别和定位那些因特定 LaTeX 宏包导致转换不正确的具体问题至关重要。

我们的首要目标是让论文更容易被访问,因此在测试阶段,我们将 功能优先于形式

HTML 是一种与 PDF 不同的媒介,它自身也带有优势。除了与辅助技术的兼容性更好之外,HTML 还能更好地适应不同设备(包括移动设备)的屏幕特性。因此,请不要仅仅因为 HTML 论文看起来与 PDF 不完全一样就提交报告。我们预期 HTML 版本的换行、空白和排版会与 PDF 有所不同。

如何提供帮助?

社区的参与对该项目的成功至关重要。

1. 阅读 HTML 论文并报告问题

我们鼓励社区成员尝试阅读您所在领域的 HTML 论文,并通过以下方式报告问题:

    • 点击论文页面上的 “Open Issue” 按钮。
    • 选中特定文本,然后点击 “Open Issue for Selection” 按钮。
    • 使用键盘快捷键 Ctrl+?

2. 帮助改进从 LaTeX 的转换

不同角色的成员都可以为改善转换质量做出贡献:

    • 作者: 遵循我们的 LaTeX 标记最佳实践指南,以确保您的论文能成功转换为 HTML。
    • 开发者: LaTeXML 团队维护了一个公开的问题列表,欢迎开发者贡献代码和解决方案。
    • 出版商与会议组织者: 审查并推荐使用受支持的软件包,可以极大地促进科学界内容的无障碍性。

最后,我们要特别感谢所有慷慨分享其见解、专业知识和指导的残障科学家,以及为该项目提供基础支持的 LaTeX 项目和 LaTeXML 团队。