人気記事
-
物体検出の代表アルゴリズム YOLOシリーズを徹底解説!【AI論文解説】
はじめに 物体検出の世界でリアルタイム処理を可能にし、現在でも主力として活躍するYOLOシリーズについて解説したいとおもいます。 YOLOは2015年6月に Joseph Redmon氏によって& […]
-
自然言語処理の必須知識 Transformer を徹底解説!
はじめに 自然言語処理(Natural Language Processing: NLP)の文脈から誕生したTransformerはそのモデルのシンプルさにもかかわらず、大きな成果をあげることに成功 […]
-
代表的モデル「ResNet」、「DenseNet」を詳細解説!
勾配消失問題を解消し、層を深くするために開発されたResNet及びDenseNetについて解説します。 ResNet元論文「Deep Residual Learning for Image Reco […]
-
画像認識の革新モデル!脱CNNを果たしたVision Transformer(ViT)を徹底解説!
はじめに AIの世界では毎年最先端(SOAT:state-of-the-art technology)モデルが発表され、多くの新技術が生まれています。しかし、2017年に発表され「Atteintio […]
-
話題のOpenAIの新たな画像分類モデルCLIPを論文から徹底解説!
はじめに OpenAIより幅広いタスクでゼロショット転移(タスクごとのFine-tuningを必要としない)が可能な事前学習画像分類モデルCLIPが発表されたので、論文をもとに詳細解説します。簡単に […]
-
音声認識・合成技術の代表的モデル「WaveNet」を詳細解説!
WaveNet及び周辺知識についてまとめました。 音声認識と音声合成の概要 音声認識とは、人の声の波形を機械で処理し、どんな内容(文)であったかを推定する技術である。また音声合成とは、与えられた内容 […]
-
【実例紹介】時系列予測の標準化・テンプレート化事例
- 2021.03.24
- ラボ
はじめに 時系列データを誰でもある程度正確に予測できるような仕組みの構築を行いました。具体的には、データから予測モデルを構築し、だれでも新規のデータに合わせてモデルを常に最適化できるような標準化を行 […]
-
自然言語処理の必須知識 BERT を徹底解説!
はじめに BERT(Bidirectional Encoder Representations from Transformers)は、2018年10月にGoogleが発表した自然言語処理(Natu […]
-
Focal Lossを提案した革新的物体検出モデルRetinaNetを解説!
はじめに 本記事は、物体検出モデルであるRetinaNetを通して「モデルの概念理解」と「コードの理解」ができることを目的としたものです。そのため①モデルの解説、②コードの解説、という二部構成になっ […]
-
モバイル向けの代表モデルMobileNetV2を詳細解説!
2018年にGoogleの研究チームから発表されたMobileNetV2の詳細解説を発表論文とGoogleブログを主な参考文献として行う。なお、説明のために引用した図は下記発表論文もしくはGoogle […]