半導体業界でのAIモデル軽量化

半導体業界でのAIモデル軽量化

2024年3月 半導体関連会社M社に対して、AIモデルを特定のエッジデバイスに適応させるための軽量化を行った。

特殊なデバイスに適応させるよう、軽量化を実施

今回、推論するデバイスはモデルサイズでかなりの軽量化が必要であったため、ニューラルネットのアーキテクチャの見直しから行った。その後、特定のデバイスに適応できるよう、量子化、pruningを行った。その結果、特定のデバイスで速度、データ容量ともに要件を満たすものが得られた。