WebNN

从 U-Net 到 DiT：在浏览器中运行 Z-Image Turbo

Z-Image Turbo 是一个 60 亿参数的可扩展单流扩散 Transformer（S3-DiT）模型，完全通过 WebGPU 在浏览器中运行。英特尔 Web 平台工程团队通过 ONNX 转换、INT4/FP16 量化和算子融合对模型进行了适配——实现了 7 倍的模型体积缩减和最高 7 倍的推理加速，在 AI PC 硬件上实现了实时、端侧的文生图生成。 Read more

2026年4月16日

ONNX2WebNN - 将 Web AI 框架开销降低至 1/400

WebNN 是一个隐私优先的浏览器 API，支持硬件加速的客户端 AI 推理。虽然框架提供了便利，但它们会增加包大小（2-20 MB）并减慢启动速度。相比之下，直接在原生 JavaScript 中使用 WebNN 的开销极小（数十到数百 KB）。ONNX2WebNN 和基于浏览器的代码生成器等工具可以自动将 ONNX 模型转换为优化的 WebNN 代码，支持布局调优和量化。 Read more

2025年7月2日