WebNN
从 U-Net 到 DiT:在浏览器中运行 Z-Image Turbo
Z-Image Turbo 是一个 60 亿参数的可扩展单流扩散 Transformer(S3-DiT)模型,完全通过 WebGPU 在浏览器中运行。 英特尔 Web 平台工程团队通过 ONNX 转换、INT4/FP16 量化和算子融合对模型进行了适配——实现了 7 倍的模型体积缩减和最高 7 倍的推理加速, 在 AI PC 硬件上实现了实时、端侧的文生图生成。 Read more
ONNX2WebNN - 将 Web AI 框架开销降低至 1/400
WebNN 是一个隐私优先的浏览器 API,支持硬件加速的客户端 AI 推理。虽然框架提供了便利,但它们会增加包大小(2-20 MB)并减慢启动速度。 相比之下,直接在原生 JavaScript 中使用 WebNN 的开销极小(数十到数百 KB)。ONNX2WebNN 和基于浏览器的代码生成器等工具可以自动将 ONNX 模型 转换为优化的 WebNN 代码,支持布局调优和量化。 Read more
Last updated on