德承工控机GP-3100在Ubuntu操作系统下[卡顿/死机]的排查与解决方法
供稿:工控网

Ubuntu系统发生卡顿或死机的情况,若在工业环境中可不是一件小事,这将会直接导致生产中断、数据丢失,严重的话甚至可能会引发一系列的安全事故。
生产中断与效率下降:自动化控制、数据采集等任务延迟或失败,会造成生产线停工、效率降低和经济损失。
数据丢失与损坏:未保存的数据可能丢失,数据库或文件系统损坏。
设备损坏风险:异常关机可能会造成硬件损坏,且频繁故障会增加维护工作量和备件更换的成本。
安全隐患:控制系统卡顿可能会引发不可控的安全事故。
当Ubuntu系统出现卡顿或死机时,可按照以下步骤进行排查和解决。这些方法从简单到复杂,可优先尝试这些较为安全的方式,避免直接断电重启工控机造成数据丢失的可能性。
Linux系统-应用问题全面剖析Ⅵ:
德承工控机GP-3100在Ubuntu操作系统下[卡顿/死机]的排查与解决方法
一、硬件配置
工控机型号:德承 Cincoze GP-3100
CPU:Intel® Core® i9-14900
内存:DDR5 5600 MHz 32GB x2
存储:NVMe SSD 1TB
显卡:NVIDIA GeForce RTX 5070 Ti x2
操作系统:Ubuntu 24.04.1 LTS

Cincoze GP-3100
第14/13/12 代 Intel® Core™ 模组化 GPU 工控机,支持双全长 GPU 扩展
Intel® 第 14/13/12 代 Raptor Lake-S Refresh / Raptor Lake-S / Alder Lake-S Core™ i9/i7/i5/i3 处理器(功耗达65W)
2个DDR5 SO-DIMM插槽,支持ECC/非ECC类型内存,高达5600MHz,64GB
4个2.5GbE LAN和可选的2个10GbE LAN、4个1GbE LAN、4个1GbE M12 LAN
1x M.2 Key E 2230用于无线 / Intel CNVi 模块扩展、1x M.2 Key B 3052/3042用于 5G / 存储 / 扩展卡扩展、1x M.2 Key B 2280用于扩展卡扩展
4 个 2.5" 可热插拔 SATA III HDD/SSD 硬盘槽(最大高度 15 mm),1x M.2 key M 用于 NVMe SSD
用于I/O扩展的可选 CMI 模块,用于点火感应和PoE的可选CFM模块
宽工作温度 -40°C 至 70°C
MIL-STD-810H 军用标准和 EN50155轨道交通认证(EN 50121-3-2 only)
二、排查步骤
1. 系统卡顿(键盘鼠标能响应)
如果只是系统桌面的界面卡顿,但鼠标和键盘仍有反应时,可尝试以下方法:
1.1 重启图形界面:按下 Ctrl + Alt + F1(或 F2~F6)进入TTY终端,输入用户名和密码登录。然后执行以下命令之一,以重启图形界面。
sudo pkill Xorg
或
sudo restart lightdm
执行后等待几秒,系统将会自动返回桌面。
1.2 检查并结束占用资源的进程:在TTY终端中,使用 ps -ef 查看进程,找到占用资源过高的进程ID(PID),然后用 kill 命令强制结束该进程。例如输入以下命令:
kill -9 1234
(命令中的1234为需要结束进程的PID,可依照实际情况更改PID)
2. 系统完全死机(键盘鼠标无响应)
如果系统完全无响应,可尝试使用:Linux 魔法系统请求键,进行安全重启,此方法会通过系统请求(SysRq)向系统内核发出指令,依次释放键盘控制、终止进程、强制关闭、同步数据并重启,避免因直接强制关机而导致数据丢失。
Linux 魔法系统请求键
(注意左右手的操作手法和步骤 & 等待系统运行的时间)
左手:按住 Ctrl + Alt 键不放
右手:按下 SysRq(与键盘上的 PrintScreen 共用)再放开,等待1-2秒
右手:按下R(R:重置键盘)再放开,等待1-2秒
右手:按下E(E:终止进程)再放开,等待30秒
右手:按下I(I:强制关闭)再放开,等待10秒
右手:按下S(S:同步磁盘)再放开,等待5秒
右手:按下U(U:只读挂载)再放开,等待5秒
右手:按下B(B:重启)再放开,之后可放开左手,系统会自动重启。
注意事项:系统正常的重启是需要时间来让系统完成的,所以不可快速的用右手连续按下 R-E-I-S-U-B,尤其是“E:终止进程”和“I:强制关闭”这2个指令,需要留给系统充足的时间运行,否则就和强制按电源按钮或是直接拔电源线断电一样,都属于是强制关机,容易造成数据丢失。
3. 调整内存交换空间
卡顿有时候是因内存不足导致交换空间(swap)过度使用,可尝试调整内存的交换空间,以优先采用物理内存。
3.1 查看当前设置,输入以下命令:
cat /proc/sys/vm/swappiness
默认值为60,可降低至10以优先使用物理内存,输入以下命令:
sudo sysctl vm.swappiness=10
此为临时性的修改,在下次重启系统后仍会恢复默认值60
(数值越低则速度越快,0是最大限度的使用物理内存)
3.2 为使设置能够永久生效,需编辑配置文件,输入以下命令:
sudo gedit /etc/sysctl.conf
在文档的末尾添加一行:vm.swappiness=10,保存后再输入以下命令:
sudo sysctl -p
4. 清理磁盘空间
磁盘空间占满也会降低系统性能,建议可以清理缓存和无用文件,来确保磁盘有足够的空间运行。
4.1 检查磁盘空间,输入以下命令:
df -h
4.2 清理缓存和无用文件,依次输入以下命令:
sudo apt-get autoremove
sudo apt-get autoclean
sudo apt-get clean
sudo rm -rf /home/user/.local/share/Trash/*
(将“user”改为实际系统的用户名)
5. 更新显卡驱动
显卡驱动不兼容也是造成死机的常见原因,打开“软件与更新”中的“附加驱动”选项,尝试更换显卡的驱动版本。
如果上述方法仍无法解决问题,再尝试断电重启工控机。
如果重启还是无法解决问题,则需要进一步排查工控机内部的硬件(如内存、硬盘),或是重新安装Ubuntu系统。
关于德承
强固型嵌入式电脑品牌 – Cincoze德承,致力提供多元且贴近市场需求的嵌入式电脑解决方案。旗下产品线包括强固型嵌入式电脑、工业平板电脑、工业显示器及强固型GPU电脑,能快速满足垂直市场的应用需求,尤其以工厂自动化、机械自动化、机器视觉、AIoT、机器人、无人车、自驾车、智能交通、智能仓储物流为最。多年来推出多款创新性的产品,荣获多项专利、奖项与国际认证的肯定。