1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 Linux 6.1将于十月迎来新补丁 有助于定位潜在故障的CPU插槽或核心

本帖由 漂亮的石头2022-08-26 发布。版面名称:新闻聚焦

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    486,020
    赞:
    46
    对于日常需要接触并维护大量硬件的服务器管理员来说,这里有个好消息 ——Linux 6.1 将能够在发生 Segmentation Fault 分段错误时,报告潜在有问题的 CPU 插槽 / 核心。当发现某个 CPU / 核心经常引发同样问题的时候,这项新特性就能够帮你更轻松的排查相关故障。

    [​IMG]

    (截图 viaKernel.org)​

    Phoronix指出:当前正在 TIP 排队的 x86 / cpu 分支合并窗口,将于 10 月份带来一项改进。该补丁用于在分段错误发生时,记录下有故障嫌疑的 CPU / 核心。

    若经常发现某一颗处理器、或特定内核遇到 Segmentation Fault,打印下的内容将有助于排场插槽或 CPU 核心问题。Rik van Riel 在公告中写道:


    在规模足够大的计算机群中,坏掉个别 CPU 还是相当常见的。按照设想,我们可通过内核代码的运行来辨识,以找出在特定系统上不断重复崩溃的 CPU 内核。

    不过多年来,出现问题的 CPU 故障模式,并不是千篇一律的。有时你可能只会揪出 bash、Python,或在在其它地方运行良好的各种系统守护程序中遇到分段错误。
    有鉴于此,通过将 printk() 添加到 show_signal_msg(),我们便可在遇到 Segmentation Fault 时,打印出有潜在故障的处理器插槽或内核等信息。

    尽管这项工作仍不够完美 —— 因为在故障发生和打印消息之间,任务可能还会在另一个 CPU 上被重新安排 —— 但这项工作已足够帮助人们定位到哪几个可能有内核损坏的 CPU 上。​

    如果一切顺利,这个实用补丁将于今年晚些时候正式并入 Linux 6.1 。此外你可将它视作英特尔现场扫描(Intel In-Field Scan)、MCEs、EDAC 报告等解决方案的一个有力补充。
     
正在加载...