<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          SkyThought 開源推理 AI 模型

          聯(lián)合創(chuàng)作 · 2025-02-18 07:51

          Sky-T1:在 450 美元以内训练你自己的 O1 预览模型。

          该存储库包含了用于 Sky-T1-32B-Preview 数据管理、训练和评估的代码和脚本的源代码,可以在每个目录中找到更多详细信息。

          • /data:用于训练 Sky-T1-32B-Preview 的 17k 训练数据。还添加了来自STILL-2 模型的 science 和 riddle 部分。
          • skythought/tools:Sky-T1 的训练数据管理和评估。为了生成训练数据,项目团队使用了 QwQ-32B-Preview 模型。整理 data mixture 以涵盖需要推理的不同领域,并采用拒绝采样程序来提高数据质量。
          • skythought/train:Sky-T1 的训练脚本。使用 Llama-Factory 进行训练。该模型训练了 3 epochs,学习率为 1e-5,批处理大小为 96。模型训练耗时约 19 小时,使用了 8 台 Nvidia H100 GPU,成本约为 450 美元。

          瀏覽 21
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲福利精品内射 | 亚洲综合日韩在线 | 操逼片 | 一级做aA片毛片久久久 | 2021最新无码视频 |