英特爾為Pytorch 2.0貢獻AI加速度

2023-03-16

在Python 2.0的發布中，Intel的貢獻使用pytorch的intel®擴展，Oneapi深神經網絡圖書館（Onednn）以及對英特爾®CPU的額外支持，使開發人員能夠優化人工智能（AI）的推理和培訓績效。

作為Pytorch 2.0編譯堆棧的一部分，Intel擴展的Torchinductor CPU後端優化Pytorch和Pytorch Aten CPU實現了高達1.7倍的FP32推理性能，當通過Torchbench，HuggingFace和TimM.1的更新Brings，Time Mm.1的更新表現出色的性能兼容pytor py and Pytor py and pyter py and py and py and timmm.1時，fp32推理性能。

其他優化包括：

改進了相鄰神經網絡節點之間的消息，以支持Pytorch幾何（PYG）中的圖形神經網絡，以增強Intel CPU的推理和性能培訓。
新的X86量化後端 - FBGEMM（Facebook General Matrix -Matrix乘法）和Onednn後端 - 替換FBGEMM作為X86 CPU平台的默認量化後端，以啟用更好的端到端INT8推理性能。
與Onednn的擴展使用ONEDNN圖API通過自動識別要通過融合加速的圖形分區來最大化AI硬件上有效的代碼生成。支持BFLOAT16和FLOAT32數據類型，並且只能優化推理工作負載； BF16僅在具有AVX512_BF16 ISA支持的機器上進行了優化。

更多的：閱讀完整的公告博客”慶祝Pytorch* 2.0具有新開發人員的新性能功能。 ”

相關貼文