Conversation
6ea8ccf to
8980494
Compare
9d6be57 to
4b22b71
Compare
|
translation.go 部分,只在 INT_ENUM_PEER_TAG 里加一下即可,其他地方不用改 |
c161d36 to
931bed0
Compare
@xiaochaoren1 意思是下图中红框的部分不需要,只需要在 INT_ENUM_PEER_TAG中加一下biz_type? |
cb4cefa to
c019029
Compare
AI Agent Governance背景这组改动为 AI Agent / 智能体治理补齐了从 识别、进程归属、治理事件采集、数据落库 到
变更范围deepflow(开源侧)
deepflow-core(EE / 联动依赖侧)
Reviewer Guide建议按下面顺序评审,这样最容易建立全局上下文:
核心修改说明1. 新增 AI Agent 配置与识别入口这一部分的目标,是让 AI Agent 成为一个可配置、可识别、可调参的能力,而不是写死在解析器里的特殊分 主要变化:
review 价值:
2. 引入 EE 侧 AiAgentRegistry,稳定管理 AI Agent 进程状态这一部分的目标,是把 AI Agent 的“注册 / 查询 / BPF map 同步 / 继承 / 回溯”从临时逻辑提升为一个稳定 主要变化:
review 价值:
3. 将 AI Agent 的
|
lzf575
left a comment
There was a problem hiding this comment.
ingester 写入正常。目前看新增加的几个 event 表,支持单独设置保留时长,后续需要在页面验证确认下。
|
|
||
| if (latency < tracer_ctx->io_event_minimal_duration) { | ||
| #ifdef EXTENDED_AI_AGENT_FILE_IO | ||
| if (!__ai_agent) |
There was a problem hiding this comment.
ai_agent 不受io_event的配置控制,这里存在一个需要注意的问题:
- 如果文件读写是微秒甚至纳秒级别,file读写事件可能会非常非常多,吃掉节点资源,所以这里是否需要一个
ai_agent文件读写的时间限制更好一些?
There was a problem hiding this comment.
这个担忧我确认过,但本轮不按“增加时间限制/限流”修改。PRD 在智能体数据采集里明确要求“所有文件读写事件,无需对读写时延、读写时机做限制”,功能测试用例里也有 TC-EVT-001/002/003/004 对应覆盖。因此这里不能通过在 BPF 层增加时延门槛或限流来处理。后续如果需要控制资源,只能走不改变事件可见性的优化路径,例如更强聚合、传输/存储优化或统计告警。
There was a problem hiding this comment.
这个除非有预期 AI io_event 开启纳秒级别不会影响到客户系统(比如我们测试最坏的情况也不会对客户环境产生较大影响)。这个可能再考量一下,因为我们有这样的工单影响到客户整个系统的性能, 当时关闭整个io_event功能。总之,除非我们预期对客户环境影响有限,否则我们要有办法避免。
There was a problem hiding this comment.
智能体场景下考虑到LLM本身的处理和调用时长都是秒级以上的,理论上不会出现这种极端的情况(但如果是调用工具时工具中做了这种实现那可能也无法排除),如果出现的话,可能只能关闭io采集了
22fd995 to
8b98032
Compare




This PR is for:
Support agent governance
Checklist
Backport to branches