Skip to content

CatInCup 核心特性介绍:为什么它更好?

🐱 设计哲学

1. 绝对安全的双重运行环境

"Agent 乱执行命令,把我的电脑炸了 / 删了重要文件!"

💡 CatInCup 的解决方案

在 CatInCup 中,你完全无需承受这种由于 Agent 暴走带来的系统级灾难。我们将高危任务全权交由 Agent 挂机处理的底气,来源于创新的 两级环境隔离与白名单管控

  • Docker 沙盒环境:Agent 的"专属游乐场"。所有代码执行与高效命令行工具的使用,均被强制封锁在容器内,与物理主机完全隔离。
  • 本地文件系统 (权限分级):通过严密的配置文件定义物理机与沙盒的交互边界:
    • dont_read_dirs隐私禁区。彻底屏蔽个人密钥等隐私数据,防止大模型无意泄露。
    • sandbox_dirs操作域。严格规范 Agent 在本地文件系统中的可写与可覆盖空间。
    • docker_mount挂载通道。显式打通本地与沙盒的互通桥梁,授权沙盒脚本直接处理指定的本地数据。 (注:这些文件夹内的文件将直接受沙盒环境影响,请注意安全)

2. 降维打击的架构:可定制 Harness Engineering

"那些主流框架的 Skill 机制太受限了,稍微复杂点、有特定行业逻辑的工作流 / Harness Engineering 根本没法深度定制!"

💡 CatInCup 的解决方案

传统 Agent 往往被单一的系统提示词锁死,但在 CatInCup 中,你可以在同一系统内无缝调度 AI 科研助手、量化交易员、高级程序员等多种 Expert(专家)。我们对外暴露了高度可扩展的接口:

  • 常规集成:支持标准的 Skill (符合 Anthropic 规范) 和 MCP Service (一键接入外部服务并内置回收机制)。
  • Plugin (原生插件):框架内所有 Expert 共用的基础设施,纯 Python 编写(包即工具),极大降低工具开发门槛。
  • Harness (Expert):对于特定行业的复杂需求,Skill 的约束力往往捉襟见肘。开发者可在 src/models/expert/ 下继承 BaseTask,彻底重写内置函数与状态流转,量身定制专属的 Harness Engineering 工作流,并直接享受框架的并发加速与轮询容错等基础建设。

3. 极致的上下文经济学

"叫某虾帮我修改个小文件,竟然花了我好几块钱 token!"

💡 CatInCup 的解决方案

在 CatInCup 中,你完全无需担忧账单爆炸。经过数月的深度实验验证,我们在上下文管理上进行了大量优化。在具备 KV Cache 机制的模型厂商下,这些让你省钱提速的底层优化包括但不限于

  • 静态路由分配:摒弃传统将 Tool Schema 动态塞入 System Prompt 的做法。由于模型厂商通常在 System Prompt 之后注入 Tool Schema,动态挂载会导致缓存直接失效。我们改用路由工具分配的思路,确保大模型 KV Cache 命中率 始终维持在极高水位(最新架构的主Agent 平均命中率已稳定在93.1%)。
  • 响应速度质变:极高的缓存命中率不仅大幅压降了 Token 账单,更让每轮对话的响应速度获得了肉眼可见的提升。

4. 工业级稳定:7x24 小时无人值守

"让它跑个长任务,我还得像个监工一样死死盯着屏幕,生怕它中途报错中断,这哪叫自动化!"

💡 CatInCup 的解决方案

在 CatInCup 中,你可以24小时放心让 Agent 去管,这得益于将庞大且专业的操作系统(OS)领域知识引入了架构设计中。为了保证系统的绝对稳定工作状态,我们在底层进行了大量机制设计,包括但不限于

  • RR 调度与防堵塞:采用 API 线程级设计与时间片轮转 (Round-Robin) 调度策略,确保任何单一 API 请求都不会超时或拖垮全局。
  • 缓存级任务绑定:每个子任务独立绑定特定的 API Key,避免并发请求造成的上下文交织,精准保证 KV Cache 命中。
  • 状态机实时落盘:子任务的执行状态会在每轮对话结束时实时保存。即便遭遇不可逆的断电终止,系统内置的兜底修复逻辑也支持你随时 reload,无缝恢复对话。妈妈再也不用担心 Agent 乱来而我只能干看着——你可以随时打断并追加新指令!

5. 多线程非阻塞的后台子任务:真正的"多核"并发体验

"给 Agent 派了个稍微大点的数据处理任务,聊天框就直接被死死锁住,我想问个新问题都得干等着!"

💡 CatInCup 的解决方案

在 CatInCup 中,我们彻底打破了传统 Agent "一问一答、单线阻塞"的低效模式,赋予了你真正的 多任务统筹能力。这得益于我们底层的子任务调度设计:

  • 后台静默运行,主界面永不阻塞:当你下达复杂指令(如批量处理文献、抓取数百个网页)后,任务会被 Agent 切入后台作为子任务执行。你的主会话窗口 绝对自由,你可以继续和 Agent 探讨其他问题,或者直接丢给它下一个新任务。
  • 多 Agent / Expert 并发协作:结合前文提到的可定制工作流,你可以真正体验到"带团队"的感觉。由于底层实现了 API 线程级隔离与 KV Cache 的独立绑定,你可以让 Coding Agent 在后台沙盒里跑编译,同时让 Trading Agent 帮你拉取最新的 A 股研报。 你的私人助手不再是一个单线程的机器人,而是一个可以多核并发工作的精英团队。
  • 上帝视角的进度掌控:即使所有任务都在后台狂奔,你依然可以通过系统的任务调度中心,随时查看每个子任务的实时状态机流转进度或者动态注入指令。你不仅是使用者,更是掌控全局的指挥官。
  • 随时注入指令的自由:CatInCup提供了强行注入指令的功能,能让你在Agent忙活的时候随时注入你的指令或观点。

6. 具备"灵魂"的私人助手

"这 Agent 真是有严重的失忆症,昨天刚手把手纠正过的问题,今天用起来它又忘得一干二净!"

💡 CatInCup 的解决方案

在 CatInCup 中,Agent 会在交互中自动总结经验教训、更新你的用户画像,牢记你的小偏好。

  • 摒弃臃肿:经过实践,我们发现传统 RAG 或 Mem0 等记忆系统在 个人使用场景 下过于低效且缺乏逻辑。CatInCup 删繁就简,使用极低损耗的轻型备忘录驱动记忆体系。
  • 灵魂定义 ( SOUL.md ):开放底层人格接口。你可以通过修改该文件,为你的专属私人助手注入独一无二的"灵魂"设定与行事风格。

🗺️ 演进路线图

  • 不涉及本地文件系统的工具 CLI 化
  • 进一步简化内核
  • 增加多模态模型交互接口
  • 增加模型厂商 API 映射层
  • 打造专属的 Harness Engineering 开源生态社区
  • 研发更加先进且适合个人场景的记忆系统技术
  • 添加更多更丰富的 Sensor

期待你的参与!欢迎贡献!让我们一起构建更好的 CatInCup!