Pytorch Onnx - 搜索 News

2 天

高通新款云端芯片公开！借推理抢英伟达蛋糕

除了硬件，高通同时在推进面向超大规模推理的端到端软件栈，承诺支持主流框架与工具链（如PyTorch/ONNX、vLLM、LangChain、Hugging Face等），并提供一键部署与运维工具，以降低客户TCO并加速模型在生产环境的落地。

小熊财经 on MSN

从几周到几分钟：CTO亲述AI智能体落地端侧，如何重塑企业运营效率

随着《关于深入实施“人工智能 ...

2 天

高通新款云端芯片公开！借推理抢英伟达蛋糕，市值一夜暴涨197.4亿美元

你的下一块AI芯片，何必非得是英伟达和AMD。高通宣布推出两款全新的AI芯片——AI200和AI250，正式进军数据中心市场。消息一出，高通股价一度飙升超20%，创自2019年以来的最大单日涨幅。巧的是，高通上一款数据中心产品AI ...

21 小时

米尔RK3576边缘计算盒精准驱动菜品识别模型性能强悍

在人工智能与边缘计算深度融合的今天，将AI模型高效部署于终端设备已成为产业智能化的关键。本文将分享基于米尔MYD-LR3576边缘计算盒子部署菜品识别安卓Demo的实战经验。该设备凭借其内置的强劲瑞芯微RK3576芯片，为视觉识别模型提供了充沛的本地AI算力，成功将“智慧识菜”的能力浓缩于方寸之间，充分证明了其作为边缘AI应用坚实载体的卓越性能与可靠性。

腾讯网

2周工作2句话搞定，一位CTO的Agent实践，揭开AI重塑企业运营的秘密

在此行业背景下，智东西与国内知名AI数据服务商英泰立辰CTO高喆进行了一次深度对话，高喆在实际业务中基于惠普的ZBook Ultra高性能移动工作站实现了诸多企业AI用例的落地， ...

InfoQ中国 on MSN

使用ONNX将AI推理引入Java：企业架构师实践指南

引言尽管Python在机器学习生态系统中占据主导地位，但大多数企业应用仍然运行在Java上。这种不匹配性造成了部署瓶颈。在PyTorch或Hugging ...

腾讯网

AMD Radeon AI PRO R9700开售：国行定价10999元，多个品牌产品上架

AMD在COMPUTEX 2025上发布了基于RDNA 4架构GPU打造的Radeon AI PRO ...

6 天

寒武纪、沐曦、摩尔线程、砺算科技、燧原科技、壁仞科技、昆仑芯 ...

曾长期垄断中国 GPU 市场的英伟达，因外部环境变化陷入份额 “断层”，英伟达 CEO 黄仁勋近期在采访中确认，其中国市场份额已从巅峰时期的 95% 跌至 0%。这一剧变源于 2025 ...

51CTO

#码力全开·技术π对# 如何在 GKE 上为 GPU 推理服务配置 Triton Inference Server 与动态批处理？如何在 GKE 上为 GPU 推理服务配置 Triton Inference Server 与动态批处理（Dynamic Batching）？一个 AI 平台需在 GKE 上部署多个深度学习模型（TensorFlow, PyTorch, ONNX），并应对高并发 ...

GitHub