企業 AI 資料優化新工具 Blockify 5 月 9 日由 akshay_pachaar 整理推廣、宣稱在 RAG(Retrieval-Augmented Generation)流程中、可把企業資料庫壓縮 40 倍、查詢 token 用量減 3 倍、向量搜尋準確率提升 2.3 倍。Blockify 官方 GitHub說明:產品由 Iternal Technologies 推出、用「IdeaBlock」結構化知識單元取代傳統 chunking、並透過去重合併讓知識庫保持精簡、連貫、可治理。
核心概念:用 IdeaBlock 取代傳統 chunking
Blockify 的技術設計:
傳統做法:把長文件切成固定大小的 chunk、嵌入向量、檢索時取 top-k
Blockify 做法:把原始內容轉換為 IdeaBlock—XML 結構化知識單元
每個 IdeaBlock 內含:自帶問題、可信答案、tag、實體、關鍵字
相似 IdeaBlock 自動去重合併、知識庫不會隨內容增長膨脹
傳統 chunking 的問題是同一資訊可能在多個 chunk 中重複出現、造成檢索冗餘與 token 浪費;IdeaBlock 透過去重把資訊密度提升、同樣內容用更小的儲存空間表達。
具體效益:壓縮 40 倍、token 減 3 倍、準確率升 2.3 倍
Blockify 公布的具體效益指標:
資料壓縮:企業資料庫縮減至原大小約 2.5%(40 倍壓縮)、保留 99% 以上資訊
每查詢 token:從約 303 個(傳統 chunk)降至約 98 個(IdeaBlock)—3.09 倍效率
向量檢索準確率:提升 2.29 倍
整體準確率改善:約 78 倍(含去重與檢索改進綜合效應)
成本節省試算:1 億查詢/年、節省 token 成本約 73.8 萬美元
78 倍的整體準確率提升是綜合效應—去重減少噪音、IdeaBlock 結構化內容對向量檢索友善、單次回答 token 數下降同時減少模型出錯空間。
整合範圍:LlamaIndex、LangChain、Milvus、Cloudflare 等主流框架
Blockify 已整合的開發者工具與基礎設施:
RAG 框架:LlamaIndex、LangChain
知識管理:Obsidian
向量資料庫:Milvus、Elastic、Supabase
邊緣運算:Cloudflare
低程式碼整合:n8n(透過工作流程模板)
Blockify 的整合策略是「不取代既有 RAG 框架、而是作為前置資料優化層」。開發者可在現有 LlamaIndex 或 LangChain 流程中、用 Blockify 替換原本的 chunking 步驟、其餘流程不變。
後續可追蹤的具體事件:Blockify GitHub 星數成長與社群採用率、Iternal Technologies 是否就 IdeaBlock 結構申請或揭露技術細節(目前標榜「patented ingestion」)、以及主流 RAG 框架是否將類似去重邏輯內建為預設功能。
這篇文章 Blockify 改寫企業 RAG:用 IdeaBlock 取代 chunking、壓縮 40 倍、token 減 3 倍 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
UXLINK 整合 Origins Network 的 AI 運算基礎設施以支援 Web3 擴容
根據 UXLINK 於 5 月 11 日發布的官方公告,這個 Web3 社交協議宣布與 Origins Network 展開策略合作,將去中心化的 AI 運算基礎設施整合進其生態系統。此合作旨在透過納入 Origins Network 的模組化區塊鏈基礎設施來強化 UXLINK 的平台,提升用於 AI 驅動的去中心化應用程式的運算能力。 此次整合將運用 Origins Network 的「Proof-of-Computation(運算證明)」機制與去中心化 GPU 運算,以提升 AI 模型訓練、資料處理與交易效率,同時降低營運成本。支援社交去中心化交易所交易、流動性質押與 AI 驅動應用程式的 UXLINK 平台,將透過此次合作獲得更佳的可擴展性與跨鏈功能。
GateNews3小時前
騰訊雲在上線當天為 Ryt Bank 的 AI 銀行服務提供支援,服務 50,000 名使用者
根據騰訊雲說法,5 月 11 日,該公司與馬來西亞的數位銀行 Ryt Bank 合作,使用騰訊雲 Chat 支援其以 AI 驅動的對話式銀行服務,透過即時訊息提供服務。該系統在啟用當天處理了 50,000 名活躍用戶且未發生停機,讓客戶能以自然語言提出付款指示,而非在 App 選單中操作。Ryt Bank 在超過七個月內已達到 1.2 百萬用戶。
GateNews5小時前
Reactor 推出即時世界模型示範,吸引 780 萬次觀看
根據 Beating 的說法,Reactor 今天推出其即時世界模型 demo,使使用者能透過基於雲端的 AI 處理產生互動式 3D 場景。該模型在公司的全球低延遲雲端基礎設施上運行,無需本地端硬體。在一段包含紅色跑車穿行異星沙漠景觀的示範影片中,AI 即時渲染地形物理與遙遠的行星物件,同時追蹤玩家操控,吸引超過 780 萬次觀看。
GateNews5小時前
Minara 今天推出首個 Hyperliquid HIP-4 預測市場 AI 為戶助理
根據 BlockBeats,Minara AI 於今天(5 月 11 日)推出 AI Prediction Copilot,成為首個與 Hyperliquid 的 HIP-4 市場整合的預測市場 AI 工具。該系統會分析 BTC 的短期趨勢、支撐與阻力位,以及市場定價差異,以提供 YES/NO 交易建議。Copilot 會即時輸出 AI 概率、市場隱含概率、優勢值(edge value)與預期報酬。
GateNews5小時前
通義與淘寶於 5 月 11 日推出 AI 購物整合
根據 Gelonghui,Qianwen 與淘寶已在 5 月 11 日完成平台全面整合,讓使用者能透過對話直接進行 AI 驅動的購物。使用者可透過 Qianwen 的應用程式選擇、比較並購買商品,而淘寶使用者則可存取「Qianwen AI 購物助理」,以運用包含 AI 試穿、折扣計算與降價提醒等功能。
GateNews6小時前
新加坡新創 Decube 在 $3M 融資後推出 Trusty AI 資料助理
根據 Decube 的內容,這家總部位於新加坡的創業公司在完成一輪 300 萬美元的融資後,推出 Trusty AI——其 Data Trust 平台中的 AI 資料助理。該工具讓企業團隊能以自然語言查詢中繼資料,並透過血緣圖以及資料品質監控器來回答關於資料相依性、事件與敏感資料流程的問題。 Decube 表示,它已為受監管產業的客戶提供服務,包括地區性銀行與金融機構;其中,印尼數位銀行 PT Superbank 被列為客戶。該公司將 Trusty AI 定位為一種解決方案,協助企業整合散落在目錄、可觀測性工具與治理系統中的中繼資料。
GateNews7小時前