Skip to content

[XPU] Auto bump XHPC to 20260602#79265

Open
paddle-xpu-bot wants to merge 1 commit into
PaddlePaddle:developfrom
paddle-xpu-bot:update-xhpc-20260602
Open

[XPU] Auto bump XHPC to 20260602#79265
paddle-xpu-bot wants to merge 1 commit into
PaddlePaddle:developfrom
paddle-xpu-bot:update-xhpc-20260602

Conversation

@paddle-xpu-bot

Copy link
Copy Markdown
Contributor

PR Category

Custom Device

PR Types

Not User Facing

Description

[XPU] Detected a new XHPC version. This PR bumps XPU_XHPC_BASE_DATE from 20260523 to 20260602.

@PaddlePaddle-bot PaddlePaddle-bot left a comment

Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🤖 Paddle-CI-Agent | pr_review | 2026-06-07 00:11:05 UTC+08:00

📋 Review 摘要

PR 概述:将 XPU XHPC 默认依赖版本从 dev/20260523 更新到 dev/20260602
变更范围cmake/external/xpu.cmake 中的 XHPC 下载基准日期。
影响面 TagBuild XPU Third-party

问题

级别 文件 概述
- - 未发现阻塞性问题。PR 规范问题在下面章节报,不在这里重复。

📝 PR 规范检查

PR 描述缺少 ### 是否引起精度变化 必填 section。develop 分支模板要求该项填写 ,本 PR 触及 XPU/XHPC 第三方依赖版本,合入前需要在 PR body 中明确声明精度影响。

可直接替换的 PR 描述
### PR Category
Custom Device

### PR Types
Not User Facing

### Description
- 修改内容:将 `cmake/external/xpu.cmake` 中默认 `XPU_XHPC_BASE_DATE``dev/20260523` 更新为 `dev/20260602`- 影响范围:启用 `WITH_XPU` 且使用默认 XHPC 下载地址的构建会拉取新版 XHPC 包;通过 `XPU_XHPC_BASE_DATE``XPU_BASE_URL` 覆盖的构建不受默认值影响。
- 验证方式:N/A

### 是否引起精度变化

@PaddlePaddle-bot

PaddlePaddle-bot commented Jun 6, 2026

Copy link
Copy Markdown

🤖 Paddle-CI-Agent | ci_status_monitor | 2026-06-19 00:50:10 UTC+08:00

CI报告基于以下代码生成(30分钟更新一次):
PR commit: 2ef1b0e | Merge base: 4d12baa (branch: develop)


1 Required任务 : 46/48 通过

总执行(rerun次数) 总任务 ✅ 通过 ❌ 失败 ⏳ 运行中 ⏸️ 等待中 跳过
173(85) 88 77 2 0 0 9
任务 错误类型 置信度 日志
Fleet Unit test (single card) 环境问题:Fleet 单卡容器未检测到 GPU Job
Check PR问题:PR 模板缺少精度变化说明 Job

2 失败详情

🔴 Fleet Unit test (single card) — 环境问题(置信度: 高)

分析器: 通用分析(fallback)

失败用例:

用例 错误摘要
tests/single_card_tests/test_autocudagraph.py 全部 14 个用例 CUDAPlace(0) 创建失败,机器未检测到 GPU

关键日志:

2026-06-09T02:11:51Z UserWarning: You are using GPU version Paddle, but your CUDA device is not set properly. CPU device will be used by default.
E0609 02:12:31 place.cc:409] Cannot use GPU because there is no GPU detected on your machine.
E ValueError: (InvalidArgument) use wrong place, Please check. (at /paddle/paddle/fluid/pybind/place.cc:412)
##[error]The action 'Single card test' has timed out after 50 minutes.
  • 根因摘要: Fleet 单卡测试容器未检测到 GPU

日志在运行 tests/single_card_tests/test_autocudagraph.py 前已经提示 GPU 版本 Paddle 未正确设置 CUDA 设备,随后 cudagraph 用例在 paddle.device.cuda.graphs.CUDAGraph 内部创建 CUDAPlace(0) 时失败。PR 只修改 cmake/external/xpu.cmakeXPU_XHPC_BASE_DATE,与 Fleet GPU 单卡 cudagraph 测试没有直接代码关联。

修复建议:

  1. 环境问题,请 rerun;若持续失败,检查 Fleet 单卡 runner 的 GPU 分配、容器 NVIDIA runtime,以及 GPU_DEVICES=0 / FLAGS_selected_gpus 是否实际映射到可见 GPU。

关联变更: cmake/external/xpu.cmake,仅更新 XPU XHPC 日期,未触及 Fleet/cudagraph/GPU place 相关逻辑。

🔴 Check — PR问题(置信度: 高)

分析器: 通用分析(fallback)

失败用例:

用例 错误摘要
Check PR Template PR body 未填写“是否引起精度变化”,脚本退出 7

关键日志:

check_pr_template: False pr: 79265
ERROR MESSAGE: 必须填写是否引起精度变化
EXCODE: 7
##[error]Process completed with exit code 7.
  • 根因摘要: PR 模板缺少精度变化字段

PR 描述当前只包含 PR CategoryPR TypesDescription,模板检查明确要求填写“是否引起精度变化”。这是 PR 元数据缺失导致的确定性失败,和 CI 环境无关。

修复建议:

  1. 按当前 PR 模板补充“是否引起精度变化”必填项;若本次 XPU XHPC 日期更新不影响数值结果,可填写“不引起精度变化/否”。

关联变更: PR 描述缺失必填字段;代码 diff 仅为 cmake/external/xpu.cmakeXPU_XHPC_BASE_DATEdev/20260523 更新到 dev/20260602

@paddle-bot paddle-bot Bot added the contributor External developers label Jun 6, 2026
@paddle-xpu-bot

Copy link
Copy Markdown
Contributor Author

/re-run all-failed

2 similar comments
@paddle-xpu-bot

Copy link
Copy Markdown
Contributor Author

/re-run all-failed

@paddle-xpu-bot

Copy link
Copy Markdown
Contributor Author

/re-run all-failed

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

contributor External developers

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants