CatInCup 核心特性介绍:为什么它更好?
🐱 设计哲学
1. 绝对安全的双重运行环境
"Agent 乱执行命令,把我的电脑炸了 / 删了重要文件!"
💡 CatInCup 的解决方案
在 CatInCup 中,你完全无需承受这种由于 Agent 暴走带来的系统级灾难。我们将高危任务全权交由 Agent 挂机处理的底气,来源于创新的 两级环境隔离与白名单管控:
- Docker 沙盒环境:Agent 的"专属游乐场"。所有代码执行与高效命令行工具的使用,均被强制封锁在容器内,与物理主机完全隔离。
- 本地文件系统 (权限分级):通过严密的配置文件定义物理机与沙盒的交互边界:
dont_read_dirs:隐私禁区。彻底屏蔽个人密钥等隐私数据,防止大模型无意泄露。sandbox_dirs:操作域。严格规范 Agent 在本地文件系统中的可写与可覆盖空间。docker_mount:挂载通道。显式打通本地与沙盒的互通桥梁,授权沙盒脚本直接处理指定的本地数据。 (注:这些文件夹内的文件将直接受沙盒环境影响,请注意安全)
2. 降维打击的架构:可定制 Harness Engineering
"那些主流框架的 Skill 机制太受限了,稍微复杂点、有特定行业逻辑的工作流 / Harness Engineering 根本没法深度定制!"
💡 CatInCup 的解决方案
传统 Agent 往往被单一的系统提示词锁死,但在 CatInCup 中,你可以在同一系统内无缝调度 AI 科研助手、量化交易员、高级程序员等多种 Expert(专家)。我们对外暴露了高度可扩展的接口:
- 常规集成:支持标准的 Skill (符合 Anthropic 规范) 和 MCP Service (一键接入外部服务并内置回收机制)。
- Plugin (原生插件):框架内所有 Expert 共用的基础设施,纯 Python 编写(包即工具),极大降低工具开发门槛。
- Harness (Expert):对于特定行业的复杂需求,Skill 的约束力往往捉襟见肘。开发者可在
src/models/expert/下继承BaseTask,彻底重写内置函数与状态流转,量身定制专属的 Harness Engineering 工作流,并直接享受框架的并发加速与轮询容错等基础建设。
3. 极致的上下文经济学
"叫某虾帮我修改个小文件,竟然花了我好几块钱 token!"
💡 CatInCup 的解决方案
在 CatInCup 中,你完全无需担忧账单爆炸。经过数月的深度实验验证,我们在上下文管理上进行了大量优化。在具备 KV Cache 机制的模型厂商下,这些让你省钱提速的底层优化包括但不限于:
- 静态路由分配:摒弃传统将 Tool Schema 动态塞入 System Prompt 的做法。由于模型厂商通常在 System Prompt 之后注入 Tool Schema,动态挂载会导致缓存直接失效。我们改用路由工具分配的思路,确保大模型 KV Cache 命中率 始终维持在极高水位(最新架构的主Agent 平均命中率已稳定在93.1%)。
- 响应速度质变:极高的缓存命中率不仅大幅压降了 Token 账单,更让每轮对话的响应速度获得了肉眼可见的提升。
4. 工业级稳定:7x24 小时无人值守
"让它跑个长任务,我还得像个监工一样死死盯着屏幕,生怕它中途报错中断,这哪叫自动化!"
💡 CatInCup 的解决方案
在 CatInCup 中,你可以24小时放心让 Agent 去管,这得益于将庞大且专业的操作系统(OS)领域知识引入了架构设计中。为了保证系统的绝对稳定工作状态,我们在底层进行了大量机制设计,包括但不限于:
- RR 调度与防堵塞:采用 API 线程级设计与时间片轮转 (Round-Robin) 调度策略,确保任何单一 API 请求都不会超时或拖垮全局。
- 缓存级任务绑定:每个子任务独立绑定特定的 API Key,避免并发请求造成的上下文交织,精准保证 KV Cache 命中。
- 状态机实时落盘:子任务的执行状态会在每轮对话结束时实时保存。即便遭遇不可逆的断电终止,系统内置的兜底修复逻辑也支持你随时
reload,无缝恢复对话。妈妈再也不用担心 Agent 乱来而我只能干看着——你可以随时打断并追加新指令!
5. 多线程非阻塞的后台子任务:真正的"多核"并发体验
"给 Agent 派了个稍微大点的数据处理任务,聊天框就直接被死死锁住,我想问个新问题都得干等着!"
💡 CatInCup 的解决方案
在 CatInCup 中,我们彻底打破了传统 Agent "一问一答、单线阻塞"的低效模式,赋予了你真正的 多任务统筹能力。这得益于我们底层的子任务调度设计:
- 后台静默运行,主界面永不阻塞:当你下达复杂指令(如批量处理文献、抓取数百个网页)后,任务会被 Agent 切入后台作为子任务执行。你的主会话窗口 绝对自由,你可以继续和 Agent 探讨其他问题,或者直接丢给它下一个新任务。
- 多 Agent / Expert 并发协作:结合前文提到的可定制工作流,你可以真正体验到"带团队"的感觉。由于底层实现了 API 线程级隔离与 KV Cache 的独立绑定,你可以让 Coding Agent 在后台沙盒里跑编译,同时让 Trading Agent 帮你拉取最新的 A 股研报。 你的私人助手不再是一个单线程的机器人,而是一个可以多核并发工作的精英团队。
- 上帝视角的进度掌控:即使所有任务都在后台狂奔,你依然可以通过系统的任务调度中心,随时查看每个子任务的实时状态机流转进度或者动态注入指令。你不仅是使用者,更是掌控全局的指挥官。
- 随时注入指令的自由:CatInCup提供了强行注入指令的功能,能让你在Agent忙活的时候随时注入你的指令或观点。
6. 具备"灵魂"的私人助手
"这 Agent 真是有严重的失忆症,昨天刚手把手纠正过的问题,今天用起来它又忘得一干二净!"
💡 CatInCup 的解决方案
在 CatInCup 中,Agent 会在交互中自动总结经验教训、更新你的用户画像,牢记你的小偏好。
- 摒弃臃肿:经过实践,我们发现传统 RAG 或 Mem0 等记忆系统在 个人使用场景 下过于低效且缺乏逻辑。CatInCup 删繁就简,使用极低损耗的轻型备忘录驱动记忆体系。
- 灵魂定义 ( SOUL.md ):开放底层人格接口。你可以通过修改该文件,为你的专属私人助手注入独一无二的"灵魂"设定与行事风格。
🗺️ 演进路线图
- 不涉及本地文件系统的工具 CLI 化
- 进一步简化内核
- 增加多模态模型交互接口
- 增加模型厂商 API 映射层
- 打造专属的 Harness Engineering 开源生态社区
- 研发更加先进且适合个人场景的记忆系统技术
- 添加更多更丰富的 Sensor
期待你的参与!欢迎贡献!让我们一起构建更好的 CatInCup!