在Python 2.0的發布中,Intel的貢獻使用pytorch的intel®擴展,Oneapi深神經網絡圖書館(Onednn)以及對英特爾®CPU的額外支持,使開發人員能夠優化人工智能(AI)的推理和培訓績效。

作為Pytorch 2.0編譯堆棧的一部分,Intel擴展的Torchinductor CPU後端優化Pytorch和Pytorch Aten CPU實現了高達1.7倍的FP32推理性能,當通過Torchbench,HuggingFace和TimM.1的更新Brings,Time Mm.1的更新表現出色的性能兼容pytor py and Pytor py and pyter py and py and py and timmm.1時,fp32推理性能。
其他優化包括:
- 改進了相鄰神經網絡節點之間的消息,以支持Pytorch幾何(PYG)中的圖形神經網絡,以增強Intel CPU的推理和性能培訓。
- 新的X86量化後端 - FBGEMM(Facebook General Matrix -Matrix乘法)和Onednn後端 - 替換FBGEMM作為X86 CPU平台的默認量化後端,以啟用更好的端到端INT8推理性能。
- 與Onednn的擴展使用ONEDNN圖API通過自動識別要通過融合加速的圖形分區來最大化AI硬件上有效的代碼生成。支持BFLOAT16和FLOAT32數據類型,並且只能優化推理工作負載; BF16僅在具有AVX512_BF16 ISA支持的機器上進行了優化。
更多的:閱讀完整的公告博客”慶祝Pytorch* 2.0具有新開發人員的新性能功能。 ”