【Word2vecなどの出力層高速化】巨大なソフトマックス関数の課題と重点サンプリングによる解決

分布仮説(distributional hypothesis)に基づくWord$2$vecなどの学習にあたっては、出力層が語彙の数に対応する分類問題に対応するので、そのまま取り扱うと巨大なソフトマックス関数の取り扱いが必 … 続きを読む 【Word2vecなどの出力層高速化】巨大なソフトマックス関数の課題と重点サンプリングによる解決