本地化/日语

来自 ArchWiki

本文介绍如何设置日语语言环境和输入法。它仅涵盖一般和推荐的情况。有关替代方案的完整详细信息(例如,在 tty 上的日语输入或不太常见的输入法框架),请参阅各自的说明。它不包括在控制台/tty 上设置日语输入。

字体

要显示日文字符,必须安装日语(或中文)字体。如果文本在屏幕上显示为乱码,请确保您的系统上安装了合适的日语(中文也可以)字体。

以下是一些推荐的日语字体(有关更多字体或其配置,请参见 字体字体配置

  • adobe-source-han-sans-jp-fonts - 日语 OpenType/CFF 字体,哥特式(无衬线)风格。
  • adobe-source-han-serif-jp-fonts - 日语 OpenType/CFF 字体,Mincho(衬线)风格。
  • noto-fonts-cjk - Google Noto CJK 字体。
  • otf-ipafont - 正式风格的日语哥特式(无衬线)和 Mincho(衬线)字体集;最高质量的开源字体之一。openSUSE-ja 的默认字体。
  • otf-ipaexfont - ipafont 的更新版本。
  • ttf-hanazono - 免费的日文汉字字体,Mincho(衬线)风格。
  • ttf-sazanami - 日语免费 TrueType 字体。这已过时且不再维护,但可能在某些环境中定义为后备字体。
  • ttf-koruriAUR - 通过混合 ttf-mplusAUR 和 Open Sans 获得的日语 TrueType 字体
  • ttf-monapoAUR - 用于正确显示 2channel Shift JIS art 的日文字体。
  • ttf-mplus-gitAUR - 现代哥特式风格的日语轮廓字体。它包括所有日语平假名/片假名、基本拉丁文、拉丁文-1 增补、拉丁文扩展-A、IPA 扩展和大多数日语汉字、希腊文、西里尔文、越南文,具有 7 种字重(比例)或 5 种字重(等宽)。
  • ttf-vlgothic - 日语哥特式字体。Debian/Fedora/Vine Linux 的默认字体
  • ttf-kanjistrokeordersAUR - KanjiStrokeOrders 字体,指示字符的笔顺。

区域设置

有关详细信息,请参见 locale

区域设置用于正确显示区域或语言/区域设置特定的标准。为确保启用日语区域设置,请确认 ja_JP.utf8 在以下命令的输出中

$ locale -a

要启用日语区域设置,请取消注释 /etc/locale.gen 中的 ja_JP.utf8

/etc/locale.gen
...
#ja_JP.EUC-JP EUC-JP
ja_JP.UTF-8 UTF-8
#ka_GE.UTF-8 UTF-8
...

之后,重新生成您的区域设置

# locale-gen
注意: 通常建议使用 UTF-8 字符集而不是其他字符集。

日语输入

本文或章节需要改进语言、wiki 语法或风格。请参阅 Help:Style 以供参考。

原因: 虽然这试图避免过多重复专用页面,但可能也应该删除每个工具中的环境变量中的重复项。Help:Reading#Organization (在 Talk:Localization/Japanese 中讨论)

要使用西式键盘输入日文字符,需要使用输入法(或输入法编辑器 (IME))将 罗马字 转换为 假名汉字Wikipedia:日语罗马字 为了方便地在不同的 IME 之间切换(例如,在英语和日语输入之间切换),IME 通常作为输入法框架 (IMF) 的一部分发挥作用,以便轻松地在不同的键盘布局之间切换。

输入法框架 (IMF)

最常见的 IMF 是 IBus(在基于 GTK 的环境中更常见)和 Fcitx5(在基于 Qt 的环境中更常见),它们支持所有可用的日语 IME。有关 IMF 和支持的 IME 的完整概述,请参见此表。本文仅简要介绍 #Fcitx5#IBus 的安装和配置。

Fcitx5

注意
  • 自 2020 年 11 月以来,Fcitx 软件包已被 Fcitx5 取代,Fcitx 已进入维护模式。建议用户使用 Fcitx5 而不是 Fcitx。
  • fcitx5 仅包含基本框架,而 fcitx5-im 组还包括用于 GTKQt 应用程序的 输入法模块,以及配置工具。这涵盖了大多数情况。

在大多数情况下,安装 fcitx5-im 组就足够了。有关完整详细信息和说明,请参见 Fcitx5#安装

提示
  • fcitx5-im 组支持大多数 GTKQt 应用程序。如果您发现问题,可以安装 fcitx5-qt4-gitAURfcitx5-qt6-gitAUR 和/或 fcitx5-lua 分别用于 Qt4Qt6 以及日期和时间支持。
  • Fcitx 附带有限数量的主题,可以使用配置工具进行配置。有关主题和外观的更多详细信息,请参见 Fcitx5#主题 以获取更多主题和信息。

要启用 Fcitx5,请至少配置以下环境变量

GTK_IM_MODULE=fcitx
QT_IM_MODULE=fcitx
XMODIFIERS=@im=fcitx
注意: 即使使用 Fcitx5,也不要fcitx 替换为 fcitx5

IBus

安装 ibus 软件包。有关更多信息,请参见 IBus#安装

要启用 IBus,请至少配置以下环境变量

GTK_IM_MODULE=ibus
QT_IM_MODULE=ibus
XMODIFIERS=@im=ibus

输入法编辑器 (IME)

Fcitx5IBus 都支持所有可用的日语 IME。请按照说明安装您选择的 IME。如果犹豫不决,#Mozc 是一个不错的推荐。

Mozc

来自该项目的 主页

Mozc 是一款日语输入法编辑器 (IME),专为 Android OS、Apple OS X、Chromium OS、GNU/Linux 和 Microsoft Windows 等多平台设计。这个开源项目源自 Google 日语输入法

安装 您选择的 IMF 的 Mozc 版本(例如,用于 Fcitx5 的 fcitx5-mozc 或用于 IBus 支持的 ibus-mozcAUR)。

提示: 通过安装 emacs-mozcAUR 软件包,也可以在 Emacs 中启用 Mozc。

Anthy

注意: Anthy 自 2009 年以来实际上已经停止开发。[1]

Anthy 受大多数 IMF 支持或内置于其中,但实际上已经停止开发。

安装 您选择的 IMF 的 Anthy 版本(例如,用于 Fcitx5 的 fcitx5-anthy 或用于 IBus 支持的 ibus-anthy)。

SKK (libskk)

Simple Kana to Kanji (SKK) 是一种基于 Emacs 的基本假名到汉字转换方法。它由佐藤雅彦博士(京都大学名誉教授)(旧链接)设计,并于 1987 年创建。[2] SKK 的一个独特功能是它逐字转换(单字转换),而不分析语法或文法。

安装 您选择的 IMF 的 libskk 版本(例如,用于 Fcitx5 的 fcitx5-skk 或用于 IBus 支持的 ibus-skk)。

提示: 安装 fcitx5-skkibus-skk 会安装 skk-jisyo 字典软件包。SKK 字典可以使用可选的 skktools 软件包进行管理。

KKC (libkkc)

来自该项目的 GitHub 页面

libkkc 提供了一种从假名字符串到假名-汉字混合字符串的转换器。它以 GNU Emacs 中的 kkc.el 命名,这是一个简单的假名汉字转换器,而 libkkc 尝试使用 N-gram 语言模型以稍微复杂的方式转换句子。

安装 您选择的 IMF 的 libkkc 版本(例如,用于 Fcitx5 的 fcitx5-kkc 或用于 IBus 支持的 ibus-kkc)。

用于日语输入的 Google CGI API

可用的 IM 框架:uim

用于日语输入的 Google CGI API (Google-CGIAPI-Jp) 是一项 CGI 服务,用于通过 Google 在互联网上提供日语转换。它可以在 Web 浏览器上使用。它的转换引擎似乎与 Google 日语输入法相当,因此转换质量可能比 Mozc 更好。

注意: 此服务以纯文本形式发送/接收预编辑和候选词(截至 2012-09)。

您可以通过 uim 使用它。在 uim-im-switcher-gtk/gtk3/qt4 或 uim-pref-gtk/gtk3/qt4 上选择“Google-CGIAPI-Jp”。

参见