Tether 推出跨平台 BitNet LoRA 框架,用于在消费者设备上进行 AI 训练

CryptoPulse Elite

Tether Launches Cross-Platform BitNet LoRA Framework for AI Training on Consumer Devices 泰特的QVAC部门于2026年3月17日宣布推出全球首个面向微软BitNet模型(1位LLMs)的跨平台LoRA微调框架,实现了在消费者GPU和智能手机上进行亿参数AI训练与推理。

该框架集成于QVAC Fabric中,显著降低了内存和计算需求,使在包括iPhone 16、Galaxy S25和Pixel 9在内的设备上微调高达130亿参数的模型成为可能,125M参数模型在移动硬件上大约10分钟即可完成训练。

此次发布标志着泰特战略重心从稳定币发行商向更广泛基础设施提供商的重大转变,挑战由云服务提供商和专用NVIDIA硬件主导的集中式AI开发模式。

技术突破:边缘设备上的BitNet LoRA

跨平台能力

QVAC Fabric框架支持在异构消费硬件上进行LoRA(低秩适应)微调和推理加速,包括:

桌面GPU:AMD、Intel和NVIDIA

苹果生态系统:Apple Silicon M芯片和Bionic移动GPU

移动GPU:Adreno(三星)、Mali等

这一广泛兼容性消除了之前对企业级NVIDIA系统或云基础设施的依赖,打破了AI开发集中在拥有专用硬件预算的组织中的局面。

移动端性能基准

泰特工程团队在旗舰智能手机上成功完成微调,取得以下成果:

125M参数模型:在三星Galaxy S25(Adreno GPU)上对约300份(约18k tokens)生物医学数据集微调约10分钟

1B参数模型:在三星S25上用约1小时18分钟完成相同生物医学数据的微调,在iPhone 16上用约1小时45分钟

最大容量:在iPhone 16上成功微调高达130亿参数的模型,远超典型的3B以下参数演示的边缘设备能力

推理性能提升

BitNet在移动GPU上的推理表现相比CPU基线有显著加速:

  • 速度提升:GPU性能比CPU快2到11倍(测试设备范围内)

  • 实际意义:移动GPU现可支持此前需专用昂贵硬件或数据中心的工作负载

内存效率优势

可量化的减少

基准测试显示,与传统模型相比,显存节省显著:

  • BitNet-1B(TQ1_0):比Gemma-3-1B(16位)节省高达77.8%的显存

  • 与Qwen3-0.6B对比:比16位版本少65.6%的显存

这些节省适用于推理和LoRA微调工作负载,为硬件上原本不足以支持更大模型和个性化流程提供了宝贵的内存空间。

架构优势

该框架使在边缘设备上微调比Q4非BitNet模型大两倍的模型成为可能,彰显了BitNet架构的卓越内存效率。

战略意义

去中心化AI开发

泰特CEO帕奥洛·阿尔多伊诺将此次发布置于更广泛的可访问AI愿景中:“智能将成为未来社会的关键决定因素。当训练大型语言模型依赖集中式基础设施时,创新停滞,生态系统脆弱,社会平衡受到威胁。通过在包括智能手机在内的消费者硬件上实现有意义的大模型训练,泰特的QVAC证明了先进AI可以去中心化、包容且赋能每个人。”

联邦学习的实现

效率提升使得联邦学习成为可能,允许在分布式设备上训练和共享微调更新,同时保持敏感用户数据的本地化。这减少了对集中式基础设施的依赖,促进了模型的协作改进。

数据隐私优势

通过减少对云提供商的依赖,该框架使用户在微调过程中可以将敏感数据留在本地设备,解决了将数据传输到集中服务器的隐私担忧。

竞争定位

挑战科技巨头的AI壁垒

泰特的发布直接挑战由超大规模云服务商主导的集中式AI开发模式。通过在消费者硬件上实现有意义的AI工作,泰特将自己定位为边缘AI基础设施的重要玩家,独立于传统云端管辖。

开源推广

该框架,包括论文、适配器、基准测试和跨平台二进制文件,已在Hugging Face上开源。此举旨在让独立开发者和小型实验室能够在消费者硬件上部署AI,建立超越传统监管框架的文化和技术相关性。

泰特的战略转型

此次发布延续了泰特从稳定币发行向关键数字基础设施扩展的战略,继之前的QVAC项目,包括410亿代币的Genesis I数据集和本地AI工作台。公司已表示将在“未来数周、数月和数年”持续投资去中心化AI基础设施。

技术可用性

完整的技术文档,包括性能基准、实现细节和跨平台二进制文件,可通过Hugging Face博客获取:“通过QVAC Fabric在异构边缘GPU上进行LoRA微调BitNet b1.58 LLMs”。

关于泰特

泰特将其使命描述为通过技术推动自由、透明和创新,实现无需中介的点对点信息交流。公司旨在用去中心化基础设施取代集中式模型,强调隐私、效率和韧性。

常见问题

泰特新AI框架支持哪些硬件?

QVAC Fabric BitNet LoRA框架支持AMD、Intel和NVIDIA的消费级GPU;苹果生态系统,包括Silicon M芯片和Bionic移动GPU;以及Adreno(三星)、Mali等移动GPU。这使得在笔记本、台式机和旗舰智能手机上进行AI微调成为可能,无需专用企业硬件。

移动GPU推理速度比CPU快多少?

根据泰特的基准测试,旗舰移动设备上的GPU推理速度比CPU快2到11倍。与传统模型相比,显存使用最多节省77.8%,使得在相同硬件限制下可以运行更大模型。

在手机上微调13B参数模型有何意义?

在手机上微调130亿参数模型代表了从以往主要在设备上演示的3B以下模型或将更重工作负载转移到云端的模式的重大飞跃。这表明未来可以在本地进行模型个性化和领域适应,无需将用户数据传输到集中服务器。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

99.2%的 USDT0 持有者少于 1,000 美元

据 The Block 分享的数据,99.2% 的 USDT0 持有者——由 Tether 的(USDT)稳定币以 1:1 支持的跨链代币——拥有余额少于 1,000 美元的钱包。数据显示,小额持有者推动了大部分 USDT0 的活跃度,约 1,200 个钱包持有介于 10 万美元至 100 万美元之间的 USDT0

Crypto Frontier4小时前

参议员沃伦、怀登本周就向儿童信托贷款一事追问/施压Tether,商务部长卢特尼克:本周关于向儿童信托的贷款事项

根据彭博本周的报道,民主党参议员伊丽莎白·沃伦和罗恩·怀登向稳定币发行方 Tether 以及商务部长霍华德·卢特尼克施压,原因是据称 Tether 向一个信托机构提供了贷款,而该信托的受益人是卢特尼克的四个孩子。他们在致卢特尼克和 Tether 的信中

GateNews8小时前

Tether 提议将 Twenty One Capital 与 Strike 和 Elektron 合并;XXI 股份上涨 6.6%

根据 Tether 于周三(4 月 30 日)的公告,该公司提出一项多步骤合并计划,拟让 Twenty One Capital Inc.(NYSE: XXI)与加密交易平台 Strike 以及比特币矿企 Elektron Energy 合并。Tether Investments 为 XXI 的控股股东,该公司表示其打算投票支持

GateNews15小时前

两名美国参议员向商务部长 Lutnick 和 Tether 寻求贷款文件

据彭博新闻报道,参议员伊丽莎白·沃伦(Elizabeth Warren)和罗恩·怀登(Ron Wyden)周三向美国商务部长霍华德·卢特尼克(Howard Lutnick)以及加密货币公司 Tether 请求信息,涉及该公司与一项受益于卢特尼克子女的信托之间的贷款。参议员们写道,这笔贷款“引发了某种担忧”

GateNews17小时前

TwentyOne Capital 整合比特币挖矿、金库和金融业务,并扩张持仓

据链睿(ChainCatcher)报道,TwentyOne Capital 于 4 月 30 日公布了战略更新,将其比特币公司运营整合到五个核心领域:金融服务与分销(包括托管和机构客户基础设施)、低成本比特币挖矿以扩展金库储備

GateNews19小时前

TRC20-USDT 供应量创下 873 亿美元新高,Tron 拿下 27.3% 稳定币市场份额

据 ChainCatcher 和 CoinDesk 数据,截至 4 月 30 日,TRC20-USDT 供应量达到 873 亿美元,创下新历史高点;同时,Tron 网络今年迄今新增 60 亿美元的 USDT 发行量。Tron 的稳定币市场份额在 2026 年第一季度上升至 27.3%,而协议费用收入达到 8220 万美元

GateNews19小时前
评论
0/400
暂无评论