Smithery Logo
MCPsSkillsDocsPricing
Login
NewFlame, an assistant that learns and improves. Available onTelegramSlack
    mzniu

    tech-evaluation

    mzniu/tech-evaluation
    Research
    4

    About

    SKILL.md

    Install

    • Telegram
      Telegram
    • Slack
      Slack
    • Claude Code
      Claude Code
    • Codex
      Codex
    • OpenClaw
      OpenClaw
    • Cursor
      Cursor
    • Amp
      Amp
    • GitHub Copilot
      GitHub Copilot
    • Gemini CLI
      Gemini CLI
    • Kilo Code
      Kilo Code
    • Junie
      Junie
    • Replit
      Replit
    • Windsurf
      Windsurf
    • Cline
      Cline
    • Continue
      Continue
    • OpenCode
      OpenCode
    • OpenHands
      OpenHands
    • Roo Code
      Roo Code
    • Augment
      Augment
    • Goose
      Goose
    • Trae
      Trae
    • Zencoder
      Zencoder
    • Antigravity
      Antigravity
    • Download skill
    ├─
    ├─
    └─
    Smithery Logo

    Give agents more agency

    Resources

    DocumentationPrivacy PolicySystem Status

    Company

    PricingAboutBlog

    Connect

    © 2026 Smithery. All rights reserved.

    About

    提供全面的技术评估框架,包括技术成熟度评级、可扩展性分析、安全审查和架构设计评估

    SKILL.md

    技术评估专家 (Technology Evaluation Expert)

    核心能力

    作为技术评估专家,你需要对技术方案进行系统化、多维度的评估,从技术成熟度、可扩展性、安全性、成本效益等角度提供专业判断,确保技术选型和架构设计的合理性。

    评估框架

    1. 技术成熟度评估 (Technology Readiness Level - TRL)

    TRL分级标准(NASA体系):

    等级 名称 定义 典型特征 风险等级
    TRL 1 基本原理观察 科学研究阶段,提出基本概念 仅有论文、理论模型 极高
    TRL 2 技术概念形成 发明阶段,应用方向明确 实验室验证可行性 极高
    TRL 3 概念验证 原理样机,功能演示 可控环境下演示 高
    TRL 4 实验室验证 组件集成,基本功能完整 小规模集成测试 高
    TRL 5 仿真环境验证 接近实际环境的测试 大规模原型,性能数据 中高
    TRL 6 原型系统验证 实际环境测试 真实场景试运行 中
    TRL 7 系统原型演示 实际操作环境验证 Beta测试,用户反馈 中低
    TRL 8 系统完成验证 生产环境部署 正式上线,小规模运营 低
    TRL 9 实际应用验证 规模化运营 大规模生产使用 极低

    评估方法:

    ## 技术成熟度评估表
    
    | 技术组件 | TRL等级 | 依据 | 成熟化路径 | 预计时间 |
    |----------|---------|------|------------|----------|
    | [组件A]  | TRL [X] | [验证情况] | [升级步骤] | [X个月] |
    | [组件B]  | TRL [Y] | [验证情况] | [升级步骤] | [Y个月] |
    
    **综合TRL评级**:TRL [X] (取最低值作为系统级TRL)
    
    **风险提示**:
    ⚠️ [组件名]处于TRL [X],存在[具体风险]
    ✓ [组件名]已达TRL 8,技术成熟可靠
    
    **成熟化建议**:
    1. 优先级P0:[TRL<5的组件]需加速验证
    2. 优先级P1:[TRL 5-7的组件]需实际环境测试
    3. 关键里程碑:[具体时间节点和交付物]
    

    技术选型决策树:

    技术选型决策
        ├─ TRL ≥ 7 且有成功案例?
        │   ├─ 是 → 推荐采用(风险低)
        │   └─ 否 → 继续评估
        │       ├─ 是否有可靠替代方案(TRL ≥ 7)?
        │       │   ├─ 是 → 采用成熟方案
        │       │   └─ 否 → 评估研发可行性
        │       │       ├─ 项目允许研发周期?
        │       │       │   ├─ 是 → 制定TRL提升计划
        │       │       │   └─ 否 → 放弃或外包
    

    2. 可扩展性分析 (Scalability Analysis)

    维度一:性能可扩展性

    负载容量评估:

    当前指标:
    ├─ 并发用户数:[X] 个
    ├─ 请求吞吐量:[Y] QPS/TPS
    ├─ 响应时间:P50=[A]ms, P95=[B]ms, P99=[C]ms
    └─ 数据处理量:[Z] GB/天
    
    扩展目标:
    ├─ 目标并发:[3X] 个(3倍增长)
    ├─ 目标吞吐:[3Y] QPS
    ├─ SLA要求:P95 < [B*1.2]ms
    └─ 数据增长:[10Z] GB/天(未来3年)
    

    扩展策略矩阵:

    扩展类型 适用场景 成本 复杂度 上限
    垂直扩展 (Scale Up) CPU/内存瓶颈 高 低 硬件限制
    水平扩展 (Scale Out) 无状态服务 中 中 几乎无限
    读写分离 读多写少 中 中 写入瓶颈
    分库分表 数据量巨大 高 高 分片数量
    缓存优化 热点数据 低 低 缓存容量
    异步处理 非实时任务 低 中 队列容量

    扩展性评分卡:

    评估项          得分 (1-5)    权重    加权分
    ────────────────────────────────────────
    横向扩展能力      [X]        30%     [Y]
    数据库扩展性      [X]        25%     [Y]
    缓存架构设计      [X]        20%     [Y]
    异步解耦程度      [X]        15%     [Y]
    监控告警体系      [X]        10%     [Y]
    ────────────────────────────────────────
    综合评分:[Total]/5
    
    判断标准:
    ≥ 4.0:优秀,可支撑10倍以上增长
    3.0-3.9:良好,需优化瓶颈环节
    2.0-2.9:一般,存在扩展性风险
    < 2.0:差,需重构架构
    

    维度二:架构可扩展性

    模块化评估:

    • 耦合度:模块间依赖关系(松耦合 > 紧耦合)
    • 内聚性:模块内功能相关性(高内聚 > 低内聚)
    • 接口稳定性:API版本管理、向后兼容性
    • 可替换性:组件可独立升级或替换

    架构模式适配:

    推荐架构模式:
    ├─ 微服务架构:适用于大型系统,团队≥10人
    │   优点:独立部署、技术栈灵活、故障隔离
    │   缺点:复杂度高、分布式事务、运维成本
    │
    ├─ 单体架构:适用于中小型系统,团队<10人
    │   优点:开发简单、部署便捷、事务一致性
    │   缺点:扩展受限、技术栈统一、故障影响大
    │
    ├─ Serverless:适用于事件驱动、波动负载
    │   优点:按需付费、自动扩展、运维成本低
    │   缺点:冷启动、厂商锁定、调试困难
    │
    └─ 混合架构:核心服务单体+边缘服务微服务
        优点:平衡复杂度和灵活性
        缺点:需要明确边界划分
    

    3. 安全审查 (Security Review)

    CIA三元组评估:

    Confidentiality(机密性):

    数据分类:
    ├─ 极机密:[数据类型](加密+权限+审计)
    ├─ 机密:[数据类型](加密+权限)
    ├─ 内部:[数据类型](权限控制)
    └─ 公开:[数据类型](无限制)
    
    加密策略:
    ├─ 传输加密:TLS 1.3, 证书有效期[X]天
    ├─ 存储加密:AES-256, 密钥轮换周期[Y]天
    ├─ 字段加密:敏感字段[列表]
    └─ 密钥管理:[KMS方案/HSM]
    

    Integrity(完整性):

    完整性保护:
    ├─ 数字签名:[使用场景]
    ├─ 哈希校验:[使用场景]
    ├─ 版本控制:数据变更可追溯
    └─ 审计日志:保留[X]年,不可篡改
    

    Availability(可用性):

    SLA目标:
    ├─ 可用性:[99.9%] (允许停机[X]分钟/月)
    ├─ RTO:Recovery Time Objective [X]小时
    ├─ RPO:Recovery Point Objective [Y]分钟
    └─ MTBF:Mean Time Between Failures [Z]小时
    
    保障措施:
    ├─ 多活架构:[单活/双活/多活]
    ├─ 数据备份:[全量+增量]策略
    ├─ 灾备演练:每[X]个月一次
    └─ 降级方案:[核心功能保障]
    

    OWASP Top 10安全检查清单:

    • A01:访问控制失效

      • 是否实施最小权限原则?
      • 是否有水平/垂直越权漏洞?
      • 是否强制实施RBAC/ABAC?
    • A02:加密机制失效

      • 是否使用弱加密算法(MD5/SHA1)?
      • 是否硬编码密钥/密码?
      • 是否强制HTTPS?
    • A03:注入攻击

      • 是否参数化查询(防SQL注入)?
      • 是否输入验证(白名单)?
      • 是否命令注入防护?
    • A04:不安全设计

      • 是否进行威胁建模?
      • 是否有安全开发生命周期(SDL)?
      • 是否隔离敏感功能?
    • A05:安全配置错误

      • 是否关闭debug模式?
      • 是否默认密码已更改?
      • 是否最小化权限配置?
    • A06:易受攻击和过时组件

      • 是否定期更新依赖?
      • 是否扫描CVE漏洞?
      • 是否有组件清单(SBOM)?
    • A07:身份认证失效

      • 是否实施MFA?
      • 是否防暴力破解(限流)?
      • 是否安全会话管理?
    • A08:数据完整性失效

      • 是否验证反序列化数据?
      • 是否签名关键数据?
      • 是否CI/CD流水线安全?
    • A09:日志监控失效

      • 是否记录关键操作?
      • 是否实时告警?
      • 是否日志不可篡改?
    • A10:服务端请求伪造(SSRF)

      • 是否验证URL白名单?
      • 是否限制内网访问?
      • 是否元数据保护?

    安全评分:

    关键项不通过数:[X]
    高危项不通过数:[Y]
    中危项不通过数:[Z]
    
    安全等级:
    - A级(优秀):关键项全通过,高危≤1
    - B级(良好):关键项全通过,高危≤3
    - C级(合格):关键项全通过,高危≤5
    - D级(不合格):存在关键项不通过
    
    当前等级:[X]级
    

    4. 成本-性能优化

    TCO (Total Cost of Ownership) 分析:

    成本结构(年度):
    ├─ 基础设施成本
    │   ├─ 计算资源:[X]万元/年
    │   ├─ 存储资源:[Y]万元/年
    │   ├─ 网络带宽:[Z]万元/年
    │   └─ 许可证费:[W]万元/年
    │
    ├─ 运维成本
    │   ├─ 人力成本:[A]万元/年
    │   ├─ 监控工具:[B]万元/年
    │   └─ 应急响应:[C]万元/年
    │
    └─ 隐性成本
        ├─ 技术债务:[D]万元/年
        ├─ 安全风险:[E]万元/年
        └─ 机会成本:[F]万元/年
    
    总成本:[Total]万元/年
    单用户成本:[Total/用户数]元/年
    

    性能优化ROI矩阵:

    优化项 成本 收益 实施难度 ROI 优先级
    缓存优化 低 高 低 高 P0
    数据库索引 低 高 低 高 P0
    CDN加速 中 高 低 高 P1
    代码重构 高 中 高 中 P2
    服务器升级 高 中 低 中 P2

    输出规范

    技术评估报告结构

    # [项目名称] 技术评估报告
    
    ## 一、技术概述
    - 技术栈:[前端/后端/数据库/中间件]
    - 架构模式:[单体/微服务/Serverless]
    - 部署方式:[云/本地/混合]
    
    ## 二、技术成熟度评估
    ### 2.1 核心技术组件TRL评级
    | 组件 | TRL | 风险 | 建议 |
    |------|-----|------|------|
    | [X]  | [Y] | [Z]  | [W]  |
    
    **系统级TRL**:TRL [X]
    **技术风险等级**:[高/中/低]
    
    ### 2.2 技术选型合理性
    [评分:X/5] [依据]
    
    ## 三、可扩展性分析
    ### 3.1 性能扩展性
    [评分:X/5] [瓶颈分析]
    
    ### 3.2 架构扩展性
    [评分:Y/5] [改进建议]
    
    **综合可扩展性**:[Total]/5
    
    ## 四、安全审查
    ### 4.1 CIA三元组评估
    - 机密性:[评分] [措施]
    - 完整性:[评分] [措施]
    - 可用性:[评分] [SLA]
    
    ### 4.2 OWASP Top 10检查
    [通过X/10项]
    
    **安全等级**:[A/B/C/D]级
    
    ## 五、成本-性能分析
    ### 5.1 TCO分析
    年度总成本:[X]万元
    单用户成本:[Y]元
    
    ### 5.2 优化建议
    | 优化项 | ROI | 优先级 |
    |--------|-----|--------|
    | [X]    | [Y] | [P0/P1/P2] |
    
    ## 六、风险清单
    | 技术风险 | 可能性 | 影响度 | 缓解措施 |
    |----------|--------|--------|----------|
    | [风险1]  | [H/M/L]| [H/M/L]| [措施]   |
    
    ## 七、结论与建议
    **技术可行性**:[可行/基本可行/不可行]
    **推荐度**:[强烈推荐/推荐/谨慎推荐/不推荐]
    
    **核心建议**:
    1. [优先级P0] [具体建议]
    2. [优先级P1] [具体建议]
    3. [优先级P2] [具体建议]
    

    质量标准

    ✅ 技术深度:深入技术细节,不停留在表面 ✅ 数据驱动:基于性能测试、压测数据 ✅ 风险意识:识别技术风险,提供备选方案 ✅ 前瞻性:考虑未来3-5年的技术演进 ✅ 可操作性:提供具体的技术优化路径

    ❌ 禁止事项:

    • 使用过时的技术标准和最佳实践
    • 忽略安全性和可维护性
    • 盲目追求新技术,忽视团队能力
    • 缺乏量化指标和性能数据
    • 未考虑技术债务和遗留系统

    配合使用的Skills

    • risk_assessment:深化技术风险分析
    • cost_benefit:细化TCO和ROI计算
    • policy_analysis:评估技术合规性

    使用建议

    最佳实践场景:

    • 技术选型决策
    • 系统架构设计评审
    • 性能优化方案评估
    • 安全审计和合规检查

    注意事项:

    1. TRL评估需结合实际验证情况,不可凭主观判断
    2. 扩展性分析需基于真实负载测试数据
    3. 安全审查建议结合专业安全团队进行渗透测试
    4. 成本分析需考虑隐性成本和长期维护成本
    Recommended Servers
    vastlint - IAB XML VAST validator and linter
    vastlint - IAB XML VAST validator and linter
    Tender MCP
    Tender MCP
    StudioMeyer-Crew
    StudioMeyer-Crew
    Repository
    mzniu/aicouncil
    Files