NVIDIA/故障排除

启动失败

安装驱动后系统无法启动

如果在安装 NVIDIA 驱动后，您的系统在到达显示管理器之前卡住，请尝试禁用内核模式设置。

Xorg 加载失败或红屏死机

如果您遇到红屏并使用 GRUB，请通过编辑 /etc/default/grub 并取消注释 GRUB_TERMINAL_OUTPUT=console 来禁用 GRUB 帧缓冲。有关更多信息，请参阅 GRUB/技巧和窍门#禁用帧缓冲。

X 启动时黑屏 / X 关闭时机器断电

如果您安装了 NVIDIA 的更新，并且在启动 Xorg 后屏幕仍然黑屏，或者关闭 Xorg 导致机器断电，请尝试以下解决方法

在您的 xinitrc 前面添加 "xrandr --auto"
使用 rcutree.gp_init_delay=1 内核参数。
您也可以尝试将 nvidia 模块直接添加到您的 mkinitcpio.conf。
如果屏幕仍然黑屏，并且同时使用了 rcutree.gp_init_delay=1 内核参数和 mkinitcpio.conf 中的 nvidia 模块，请尝试重新安装 nvidia 和 nvidia-utils，按此顺序，最后重新加载驱动程序

# modprobe nvidia

已找到显示器，但没有可用的配置

有时 NVIDIA 和 X 在查找活动屏幕时遇到问题。如果您的显卡有多个输出，请尝试将显示器插入其他输出。在笔记本电脑上，这可能是因为您的显卡具有 VGA/TV 输出。Xorg.0.log 将提供更多信息。

另一种尝试是向 Section "Device" 添加无效的 Option "ConnectedMonitor"，以强制 Xorg 抛出错误并向您展示如何纠正它。有关 ConnectedMonitor 设置的更多信息，请参阅文档。

重新运行 X 后，查看 Xorg.0.log 以获取有效的 CRT-x、DFP-x、TV-x 值。

nvidia-xconfig --query-gpu-info 可能会有所帮助。

X 失败，并显示“Failing initialization of X screen”

如果 /var/log/Xorg.0.log 显示 X 服务器初始化屏幕失败

(EE) NVIDIA(G0): GPU screens are not yet supported by the NVIDIA driver
(EE) NVIDIA(G0): Failing initialization of X screen

并且 nvidia-smi 显示 No running processes found

解决方案首先是重新安装最新的 nvidia-utils，然后将 /usr/share/X11/xorg.conf.d/10-nvidia-drm-outputclass.conf 复制到 /etc/X11/xorg.conf.d/10-nvidia-drm-outputclass.conf，然后编辑 /etc/X11/xorg.conf.d/10-nvidia-drm-outputclass.conf 并添加行 Option "PrimaryGPU" "yes"。重启计算机。问题将得到解决。

Xorg 在启动时失败，但在其他情况下启动正常

在启动速度非常快的系统上，systemd 可能会尝试在 NVIDIA 驱动程序完全初始化之前启动显示管理器。只有当 Xorg 在启动期间运行时，您才会在日志中看到如下消息。

/var/log/Xorg.0.log

[     1.807] (EE) NVIDIA(0): Failed to initialize the NVIDIA kernel module. Please see the
[     1.807] (EE) NVIDIA(0):     system's kernel log for additional error messages and
[     1.808] (EE) NVIDIA(0):     consult the NVIDIA README for details.
[     1.808] (EE) NVIDIA(0):  *** Aborting ***

在这种情况下，您需要建立从显示管理器到 DRI 设备的排序依赖关系。首先，通过创建新的 udev 规则文件为 DRI 设备创建设备单元。

/etc/udev/rules.d/99-systemd-dri-devices.rules

ACTION=="add", KERNEL=="card*", SUBSYSTEM=="drm", TAG+="systemd"

然后创建从显示管理器到设备的依赖关系。

/etc/systemd/system/display-manager.service.d/10-wait-for-dri-devices.conf

[Unit]
Wants=dev-dri-card0.device
After=dev-dri-card0.device

如果您有桌面所需的其他卡，请在 Wants 和 After 中用空格分隔列出它们。

带有集成 GPU 的系统上黑屏

如果您有一个带有集成 GPU 的系统（例如 Intel HD 4000、VIA VX820 Chrome 9 或 AMD Cezanne），并且已安装 nvidia 软件包，您可能会在启动、更改虚拟终端或退出 X 会话时遇到黑屏。这可能是由图形模块之间的冲突引起的。这可以通过列入黑名单相关的 GPU 模块来解决。创建文件 /etc/modprobe.d/blacklist.conf 并阻止相关模块在启动时加载

/etc/modprobe.d/blacklist.conf

install i915 /usr/bin/false
install intel_agp /usr/bin/false
install viafb /usr/bin/false
install radeon /usr/bin/false
install amdgpu /usr/bin/false

使用多个 GPU 时，X 失败，并显示“no screens found”

在您可能在系统上安装了多个 GPU 且 X 启动失败的情况下，并显示

[ 76.633] (EE) No devices detected.
[ 76.633] Fatal server error:
[ 76.633] no screens found

那么您需要将您的独立显卡的 BusID 添加到您的 X 配置中。这可能发生在具有 Intel CPU 和集成 GPU 的系统上，或者如果您连接了多个 NVIDIA 显卡。找到您的 BusID

# lspci -d ::03xx

00:02.0 VGA compatible controller: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor Graphics Controller (rev 09)
01:00.0 VGA compatible controller: NVIDIA Corporation GK107 [GeForce GTX 650] (rev a1)
08:00.0 3D controller: NVIDIA Corporation GM108GLM [Quadro K620M / Quadro M500M] (rev a2)

然后您可以通过将其添加到 X 配置中的卡的 Device 部分来修复它。在我的例子中

/etc/X11/xorg.conf.d/10-nvidia.conf

Section "Device"
    Identifier     "Device0"
    Driver         "nvidia"
    VendorName     "NVIDIA Corporation"
    BusID          "PCI:1:0:0"
EndSection

注意： BusID 格式很重要！

在上面的示例中，01:00.0 被剥离并写为 1:0:0，但是一些转换可能更复杂。lspci 输出是十六进制格式，但在配置文件中，BusID 是十进制格式！这意味着在 BusID 大于 9 的情况下，您需要将其转换为十进制！

例如：来自 lspci 的 5e:00.0 变为 PCI:94:0:0。

Modprobe 错误：“Could not insert 'nvidia': No such device” (linux >=4.8)

对于 linux 4.8，当尝试使用独立显卡时，可能会出现以下错误

$ modprobe nvidia -vv

modprobe: INFO: custom logging function 0x409c10 registered
modprobe: INFO: Failed to insert module '/lib/modules/4.8.6-1-ARCH/extramodules/nvidia.ko.gz': No such device
modprobe: ERROR: could not insert 'nvidia': No such device
modprobe: INFO: context 0x24481e0 released
insmod /lib/modules/4.8.6-1-ARCH/extramodules/nvidia.ko.gz

# dmesg

...
NVRM: The NVIDIA GPU 0000:01:00.0 (PCI ID: 10de:139b)
NVRM: installed in this system is not supported by the 370.28
NVRM: NVIDIA Linux driver release.  Please see 'Appendix
NVRM: A - Supported NVIDIA GPU Products' in this release's
NVRM: README, available on the Linux driver download page
NVRM: at www.nvidia.com.
...

此问题是由 Linux 内核中与 PCIe 电源管理相关的错误提交引起的（如此 NVIDIA DevTalk 线程中记录的那样）。

解决方法是将 pcie_port_pm=off 添加到您的内核参数。请注意，这会禁用所有设备的 PCIe 电源管理。

系统无法从挂起状态恢复

您在日志中看到的内容

kernel: nvidia-modeset: ERROR: GPU:0: Failed detecting connected display devices
kernel: nvidia-modeset: ERROR: GPU:0: Failed detecting connected display devices
kernel: nvidia-modeset: WARNING: GPU:0: Failure processing EDID for display device DELL U2412M (DP-0).
kernel: nvidia-modeset: WARNING: GPU:0: Unable to read EDID for display device DELL U2412M (DP-0)
kernel: nvidia-modeset: ERROR: GPU:0: Failure reading maximum pixel clock value for display device DELL U2412M (DP-0).

基于 [1] 的可能解决方案

运行此命令以获取 version 字符串

# strings /sys/firmware/acpi/tables/DSDT | grep -i 'windows ' | sort | tail -1

将 acpi_osi=! "acpi_osi=version" 内核参数添加到您的引导加载程序配置中。

问题的另一个可能原因是使用了 nvidia-open 软件包，如此处所述

从挂起状态返回时黑屏

如果遇到黑屏问题且日志包含

archlinux kernel: NVRM: GPU at PCI:0000:08:00: GPU-926ecdb0-adb1-6ee9-2fad-52e7214c5011
archlinux kernel: NVRM: Xid (PCI:0000:08:00): 13, pid='<unknown>', name=<unknown>, Graphi>
archlinux kernel: NVRM: Xid (PCI:0000:08:00): 13, pid='<unknown>', name=<unknown>, Graphi>
archlinux kernel: NVRM: Xid (PCI:0000:08:00): 13, pid='<unknown>', name=<unknown>, Graphi>
archlinux kernel: NVRM: Xid (PCI:0000:08:00): 13, pid='<unknown>', name=<unknown>, Graphi>
archlinux kernel: NVRM: Xid (PCI:0000:08:00): 13, pid='<unknown>', name=<unknown>, Graphi>

您需要启用 NVIDIA 挂起、休眠和睡眠服务，如 NVIDIA/技巧和窍门#挂起后保留视频内存中所述。

崩溃和卡顿

普遍崩溃

尝试禁用 GSP 固件。
尝试在 xorg.conf 中禁用 RenderAccel。
如果 Xorg 输出关于 "conflicting memory type" 或 "failed to allocate primary buffer: out of memory" 的错误，或者在使用 nvidia-96xx 驱动程序时崩溃并显示“Signal 11”，请将 nopat 添加到您的内核参数。
如果 NVIDIA 编译器抱怨当前 GCC 版本与用于编译内核的版本不同，请在 /etc/profile 中添加

export IGNORE_CC_MISMATCH=1

如果全屏应用程序冻结或崩溃，请尝试在您的桌面环境设置中启用 Display Compositing 和 Direct fullscreen rendering 选项。

对 Meshes Shaders 6.6 的支持不佳

实际上，此错误仅存在于依赖于它们的新游戏中，例如 Final Fantasy VII Rebirth。这反映在使用 Nvidia GPU 甚至最新 beta 驱动程序时缺少环境：https://github.com/ValveSoftware/Proton/issues/8408

然而，pyroveil (https://github.com/ValveSoftware/Proton/issues/8408#issuecomment-2657340142) 最近开发，允许您绕过 spir-v 的问题，同时等待 Nvidia 的修复。

您需要按照 github 上的教程编译和安装该工具，然后按如下方式加载环境变量

PYROVEIL=1

PYROVEIL_CONFIG=/home/youruser/pyroveil/hacks/ffvii-rebirth-nvidia/pyroveil.json

OpenGL 应用程序中的视觉故障、卡顿和错误

如果您使用的是最新的 CPU（Intel Sandy Bridge (2011) 及更高版本或 AMD Zen (2017) 及更高版本），它具有微操作缓存。由于缓存别名 [2]，使用微操作缓存可能会导致 NVIDIA 驱动程序在 OpenGL 中出现问题。您通常可以在系统的 BIOS 中禁用微操作缓存，但这会以性能为代价 [3]。禁用微操作缓存也有助于解决 Xwayland 应用程序中最严重的图形故障，尽管它并没有完全解决问题 [4]。

更新和/或重启系统时内核崩溃

这是一个已知错误，存在于 NVIDIA 550 系列驱动程序中。[5] 到目前为止，原因尚不清楚，但它似乎只影响笔记本电脑。有关更多详细信息，请参阅 BBS#293400。

要解决此问题，如果硬件支持，请切换到 nvidia-open-dkms，否则请改用 nvidia-535xx-dkms^AUR。

视觉问题

避免屏幕撕裂

注意

据报道，这会降低某些 OpenGL 应用程序的性能，并可能在 WebGL 中产生问题。它还会大大增加驱动程序在负载后降低时钟频率所需的时间（NVIDIA 支持线程）。
已知 ForceFullCompositionPipeline 会破坏一些游戏，这些游戏在使用 NVIDIA 驱动程序 535 的 Proton 下使用 Vulkan。

可以通过强制完全合成管线来避免撕裂，无论您使用的是什么合成器。要测试此选项是否有效，请运行

$ nvidia-settings --assign CurrentMetaMode="nvidia-auto-select +0+0 { ForceFullCompositionPipeline = On }"

或单击X Server Display Configuration 菜单选项上可用的Advanced 按钮。选择Force Composition Pipeline 或 Force Full Composition Pipeline，然后单击Apply。

为了使更改永久生效，必须将其添加到 Xorg 配置文件的 "Screen" 部分。进行此更改时，还应在驱动程序配置中启用 TripleBuffering 并禁用 AllowIndirectGLXProtocol。请参阅下面的示例配置

/etc/X11/xorg.conf.d/20-nvidia.conf

Section "Device"
        Identifier "NVIDIA Card"
        Driver     "nvidia"
        VendorName "NVIDIA Corporation"
        BoardName  "GeForce GTX 1050 Ti"
EndSection

Section "Screen"
    Identifier     "Screen0"
    Device         "Device0"
    Monitor        "Monitor0"
    Option         "ForceFullCompositionPipeline" "on"
    Option         "AllowIndirectGLXProtocol" "off"
    Option         "TripleBuffer" "on"
EndSection

如果您没有 Xorg 配置文件，可以使用 nvidia-xconfig 为您当前的硬件创建一个配置文件（请参阅 NVIDIA#自动配置），并将其从 /etc/X11/xorg.conf 移动到首选位置 /etc/X11/xorg.conf.d/20-nvidia.conf。

注意： 使用 nvidia-xconfig 在 20-nvidia.conf 中生成的许多配置选项由驱动程序自动设置，因此不需要。要仅使用此文件来启用合成管线，只需要包含 Identifier 和 Option 值的行的 "Screen" 部分。可以从此文件中删除其他部分。

多显示器

对于多显示器设置，您需要为每个显示器指定 ForceCompositionPipeline=On。例如

$ nvidia-settings --assign CurrentMetaMode="DP-2: nvidia-auto-select +0+0 {ForceCompositionPipeline=On}, DP-4: nvidia-auto-select +3840+0 {ForceCompositionPipeline=On}"

如果不这样做，nvidia-settings 命令将禁用您的辅助显示器。

您可以使用 --query 获取当前的屏幕名称和偏移量

$ nvidia-settings --query CurrentMetaMode

上面的行适用于连接到 DP-2 和 DP-4 的两个 3840x2160 显示器。您需要通过导出 xorg.conf 来读取正确的 CurrentMetaMode，并将 ForceCompositionPipeline 附加到您的每个显示器。设置 ForceCompositionPipeline 仅影响目标显示器。

提示： 使用不同型号显示器的多显示器设置可能具有略微不同的刷新率。如果驱动程序启用了 vsync，它将仅同步到这些刷新率之一，这可能会导致在错误同步的显示器上出现屏幕撕裂。选择同步主要使用的显示器设备，因为其他显示器将无法正确同步。这可以在 ~/.nvidia-settings-rc 中配置为 0/XVideoSyncToDisplayID=，或者通过安装 nvidia-settings 并使用图形配置选项来配置。

从挂起或休眠状态恢复后屏幕损坏

如果外部显示器在挂起或休眠后未唤醒，这也适用。

请参阅 NVIDIA/技巧和窍门#挂起后保留视频内存

使用 GDM 服务时，驱动程序版本 515.43.04 [6] 解决了挂起后损坏的错误。

屏幕损坏：“六个屏幕”问题

对于某些用户，使用 GeForce GT 100M，X 启动后屏幕会损坏，分成 6 个部分，分辨率限制为 640x480。Quadro 2000 和高分辨率显示器也报告了相同的问题。

要解决此问题，请在 Device 部分中启用 Validation Mode NoTotalSizeCheck

Section "Device"
 ...
 Option "ModeValidation" "NoTotalSizeCheck"
 ...
EndSection

使用 nvidia-470 时文本和图标不可见

GTK4 的更新为依赖于 nvidia-470 驱动程序的旧显卡用户带来了问题。更新后，文本和图标随机消失，并且仅在鼠标悬停在窗口上后才重新出现。[7]

请参阅论坛以获取解决方法。

修复从睡眠状态恢复时 GNOME Shell 中的图形损坏

如果您在从睡眠状态恢复时遇到 GNOME Shell 中奇怪的字体和/或奇怪的图形故障，请尝试设置以下内核参数以启用电源管理

nvidia.NVreg_DynamicPowerManagement=0x02

性能问题

安装新驱动版本后性能下降

如果与旧驱动程序相比 FPS 下降，请检查是否启用了直接渲染（glxinfo 包含在 mesa-utils 中）

$ glxinfo | grep direct

如果命令输出

direct rendering: No

可能的解决方案可能是回退到先前安装的驱动程序版本，然后在之后重新启动。

Xorg 上极度延迟

本条目或章节的事实准确性存疑。

原因： 根据一位 NVIDIA 开发人员的说法，此问题并非 GNOME 特有，并且该问题上的其余评论均未提及多显示器设置。（在 Talk:NVIDIA/Troubleshooting 中讨论）

Mutter 的一个常见问题是动画、视频播放和游戏会导致 Xorg 上出现极度桌面延迟。

请参阅 NVIDIA/技巧和窍门#挂起后保留视频内存。

这应该可以解决此问题，但如果仍然没有解决，那么您很可能运气不佳。解决此问题的一种方法是添加以下选项

/etc/environment

CLUTTER_DEFAULT_FPS=YOUR_MAIN_DISPLAY_REFRESHRATE
__GL_SYNC_DISPLAY_DEVICE=YOUR_MAIN_DISPLAY_OUTPUT_NAME

在 NVIDIA 设置中关闭 Sync to VBlank 和 Allow flipping，并将 NVIDIA 设置配置为使用标志 --load-config-only 在启动时启动。这仍然会导致桌面行为迟缓，尤其是在最终的第二个（或第三个）显示器上，但应该会好得多。

400 系列显卡 CPU 峰值

如果您在使用 400 系列显卡时遇到间歇性 CPU 峰值，则可能是 PowerMizer 不断更改 GPU 的时钟频率引起的。将 PowerMizer 的设置从 Adaptive 切换到 Performance，将以下内容添加到 Xorg 配置的 Device 部分

 Option "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x3322; PowerMizerDefaultAC=0x1"

其他问题

应用程序启动时 Vulkan 错误

本条目或章节的事实准确性存疑。

原因： 需要其他用户确认（在 Talk:NVIDIA/Troubleshooting 中讨论）

在执行需要 Vulkan 加速的应用程序时，如果您收到此错误

Vulkan call failed: -4

请尝试删除 ~/.nv 或 ~/.cache/nvidia 目录。

HDMI 没有音频

有时，当您执行以下操作时，不会显示 NVIDIA HDMI 音频设备

$ aplay -l

在一些新机器上，NVIDIA GPU 上的音频芯片在启动时被禁用。在 NVIDIA 的网站和论坛帖子上阅读更多信息。

您需要重新加载已启用音频的 NVIDIA 设备。为了做到这一点，请确保您的 GPU 已开启（对于笔记本电脑/Bumblebee），并且您没有在其上运行 X，因为它将被重置

# setpci -s 01:00.0 0x488.l=0x2000000:0x2000000
# rmmod nvidia-drm nvidia-modeset nvidia
# echo 1 > /sys/bus/pci/devices/0000:01:00.0/remove
# echo 1 > /sys/bus/pci/devices/0000:00:01.0/rescan
# modprobe nvidia-drm
# xinit -- -retro

如果您在 NVIDIA 上运行 TTY，请将这些行放在脚本中，这样您就不会最终遇到没有屏幕的情况。

在某些情况下背光灯不会关闭

默认情况下，DPMS 应该使用设置的超时或运行 xset 来关闭背光灯。但是，可能是由于专有 NVIDIA 驱动程序中的错误，结果是一个空白屏幕，没有任何节能效果。为了解决这个问题，在错误修复之前，您可以以 root 身份使用 vbetool。

安装 vbetool 软件包。

按需关闭屏幕，然后按任意键背光灯再次亮起

vbetool dpms off && read -n1; vbetool dpms on

或者，xrandr 能够禁用和重新启用显示器输出，而无需 root 权限。

xrandr --output DP-1 --off; read -n1; xrandr --output DP-1 --auto

HardDPMS

本条目或章节需要扩充。

原因： 为“用户报告”添加参考。（在 Talk:NVIDIA/Troubleshooting 中讨论）

专有驱动程序 415 包含一项名为 HardDPMS 的新功能。一些用户报告称，这解决了通过 DisplayPort 连接的显示器挂起的问题。自 440.26 起，默认情况下启用此功能。如果您使用的是较旧的驱动程序，可以在 Device 或 Screen 部分中设置 HardDPMS 选项。例如

/etc/X11/xorg.conf.d/20-nvidia.conf

Section "Device"
    ...
    Option         "HardDPMS" "true"
    ...
EndSection

Section "Screen"
    ...
    Option         "HardDPMS" "true"
    ...
EndSection

HardDPMS 将在屏幕保护程序设置（如 BlankTime）上触发。以下 ServerFlags 将在不活动 10 分钟后将您的显示器设置为挂起

/etc/X11/xorg.conf.d/20-nvidia.conf

Section "ServerFlags"
    Option     "BlankTime" "10"
EndSection

xrandr BadMatch

如果您尝试使用 xrandr 配置 WQHD 显示器（例如 DELL U2515H），并且 xrandr --addmode 给您错误 X Error of failed request: BadMatch，则可能是因为专有 NVIDIA 驱动程序将 HDMI 输出的像素时钟最大频率限制为 225 MHz 或更低。要将显示器设置为最大分辨率，您必须安装 nouveau 驱动程序。您可以通过在内核参数中设置 nouveau.hdmimhz=297（或 330）来强制 nouveau 使用特定的像素时钟频率。

或者，可能是您的显示器的 EDID 不正确。请参阅 #覆盖 EDID。

另一个原因可能是，默认情况下，当前的 NVIDIA 驱动程序仅允许 EDID 显式报告的模式，但有时需要监视器未报告的刷新率和/或分辨率（尽管 EDID 信息是正确的；只是当前的 NVIDIA 驱动程序过于严格）。

如果发生这种情况，您可能需要在 xorg.conf 中添加一个选项以允许非 EDID 模式

Section "Device"
    Identifier     "Device0"
    Driver         "nvidia"
    VendorName     "NVIDIA Corporation"
...
    Option         "ModeValidation" "AllowNonEdidModes"
...
EndSection

这可以按输出设置。有关更多信息，请参阅 README - 附录 B. X 配置选项。

覆盖 EDID

请参阅内核模式设置#强制模式和 EDID、Xrandr#故障排除和 Qnix QX2710#使用 Nvidia 修复 X11。

使用 nvidia-settings GUI 超频不起作用

本条目或章节需要语言、wiki 语法或样式改进。请参阅 Help:Style 以供参考。

原因： 重复，模糊的“不起作用”（在 Talk:NVIDIA/Troubleshooting 中讨论）

解决方法是使用 nvidia-settings CLI 在启用超频后查询和设置某些变量（如 NVIDIA/技巧和窍门#在 nvidia-settings 中启用超频中所述，请参阅 nvidia-settings(1) 以获取更多信息）。

查询所有变量的示例

 nvidia-settings -q all

将 PowerMizerMode 设置为首选性能模式的示例

 nvidia-settings -a [gpu:0]/GPUPowerMizerMode=1

将风扇速度设置为固定 21% 的示例

nvidia-settings -a [gpu:0]/GPUFanControlState=1 -a [fan:0]/GPUTargetFanSpeed=21

一次设置多个变量的示例（将 GPU 超频 50MHz，将显存超频 50MHz，将 GPU 电压提高 100mV）

 nvidia-settings -a GPUGraphicsClockOffsetAllPerformanceLevels=50 -a GPUMemoryTransferRateOffsetGPUGraphicsClockOffsetAllPerformanceLevels=50 -a GPUOverVoltageOffset=100

超频不起作用，并显示“Unknown Error”

如果您以非 root 用户身份运行 Xorg 并尝试超频您的 NVIDIA GPU，您将收到类似于此错误的消息

$ nvidia-settings -a "[gpu:0]/GPUGraphicsClockOffset[3]=10"

ERROR: Error assigning value 10 to attribute 'GPUGraphicsClockOffset' (trinity-zero:1[gpu:0]) as specified in assignment
        '[gpu:0]/GPUGraphicsClockOffset[3]=10' (Unknown Error).

要避免此问题，Xorg 必须以 root 用户身份运行。有关详细信息，请参阅 Xorg#无根 Xorg。

功耗

本条目或章节需要扩充。

原因： 本节的重点是什么？（在 Talk:NVIDIA/Troubleshooting 中讨论）

检查驱动程序使用情况

# lsof /dev/nvidia*

kwin_wayl  867      user   17u   CHR   195,0      0t0  418 /dev/nvidia
kwin_wayl  867      user   18u   CHR   195,0      0t0  418 /dev/nvidiactl

如果在内核模块上配置了节能

$ grep . /sys/bus/pci/devices/0000:01:00.0/power/*

/sys/bus/pci/devices/0000:01:00.0/power/control:auto
/sys/bus/pci/devices/0000:01:00.0/power/runtime_active_time:445933
/sys/bus/pci/devices/0000:01:00.0/power/runtime_status:active
/sys/bus/pci/devices/0000:01:00.0/power/runtime_suspended_time:1266
/sys/bus/pci/devices/0000:01:00.0/power/wakeup:disabled

# rmmod nvidia_drm

$ grep . /sys/bus/pci/devices/0000:01:00.0/power/*

/sys/bus/pci/devices/0000:01:00.0/power/control:auto
/sys/bus/pci/devices/0000:01:00.0/power/runtime_active_time:461023
/sys/bus/pci/devices/0000:01:00.0/power/runtime_status:suspended
/sys/bus/pci/devices/0000:01:00.0/power/runtime_suspended_time:1064192
/sys/bus/pci/devices/0000:01:00.0/power/wakeup:disabled

测试软件 GL

二进制 NVIDIA 驱动程序将不遵守 Mesa 环境变量 LIBGL_ALWAYS_SOFTWARE=1，但您可以指示 libglvnd 和 EGL 通过设置以下环境变量来使用 Mesa

__GLX_VENDOR_LIBRARY_NAME=mesa
__EGL_VENDOR_LIBRARY_FILENAMES=/usr/share/glvnd/egl_vendor.d/50_mesa.json

这将导致 Mesa libgl 用于 GLX 和 EGL，并导致软件 GL 查看错误是否与 NVIDIA GL 库相关。