話題のOpenAIの新たな画像分類モデルCLIPを論文から徹底解説!
はじめに OpenAIより幅広いタスクでゼロショット転移(タスクごとのFine-tuningを必要としない)が可能な事前学習画像分類モデルCLIPが発表されたので、論文をもとに詳細解説します。簡単に […]
はじめに OpenAIより幅広いタスクでゼロショット転移(タスクごとのFine-tuningを必要としない)が可能な事前学習画像分類モデルCLIPが発表されたので、論文をもとに詳細解説します。簡単に […]
はじめに AIの世界では毎年最先端(SOAT:state-of-the-art technology)モデルが発表され、多くの新技術が生まれています。しかし、2017年に発表され「Atteintio […]
はじめに 本記事は、物体検出モデルであるRetinaNetを通して「モデルの概念理解」と「コードの理解」ができることを目的としたものです。そのため①モデルの解説、②コードの解説、という二部構成になっ […]
はじめに 今回は、ECCV’20でGoogleから新たに発表された画像検索用モデルDELG(DEep Local and Global features)について解説します。これまで画像 […]
はじめに 物体検出の世界でリアルタイム処理を可能にし、現在でも主力として活躍するYOLOシリーズについて解説したいとおもいます。 YOLOは2015年6月に Joseph Redmon氏によって& […]
はじめに BERT(Bidirectional Encoder Representations from Transformers)は、2018年10月にGoogleが発表した自然言語処理(Natu […]
はじめに 最近(2020年7月)話題のOpenAIが発表したGPT-3(Generative Pretrained Transformer‐3)についてご紹介します。 発表論文 Language M […]
はじめに 近年、画像認識の世界は目覚ましい進歩を遂げています。先日、Transformer(Attentionを利用した構造が特徴)を利用したDETRがFacebookのリサーチチームから発表され、 […]
はじめに Transformerを物体検出にはじめて取り入れた「DETR(DEtection Transformer)」が2020年5月にFacebookから発表されました。DETRは人間による手作 […]
はじめに 数年前から返信を自動で提案してくれるSmartReplyという機能がGoogleからGmailやAndroid wearなどで提供されているのをご存じでしょうか。使ったことはなくても、Gm […]
はじめに 自然言語処理(Natural Language Processing: NLP)の文脈から誕生したTransformerはそのモデルのシンプルさにもかかわらず、大きな成果をあげることに成功 […]
2018年にGoogleの研究チームから発表されたMobileNetV2の詳細解説を発表論文とGoogleブログを主な参考文献として行う。なお、説明のために引用した図は下記発表論文もしくはGoogle […]
今回は、2017年にGoogleから発表されたMobileNet(V1)について、論文やGoogleブログを参考に解説する。 (なお、とくに断りがない限り、図の引用元は下記MobileNets論文か […]
勾配消失問題を解消し、層を深くするために開発されたResNet及びDenseNetについて解説します。 ResNet元論文「Deep Residual Learning for Image Reco […]
WaveNet及び周辺知識についてまとめました。 音声認識と音声合成の概要 音声認識とは、人の声の波形を機械で処理し、どんな内容(文)であったかを推定する技術である。また音声合成とは、与えられた内容 […]
CNNをベースとした群衆カウントの論文の概要をまとめました。 参照もと論文URL https://arxiv.org/pdf/2003.12783.pdf 論文概要 論文タイトル CNN-based […]
CNNをベースとした群衆カウントの論文の概要をまとめました。 参照元論文はこちら。(画像についても、こちらの論文より引用しています。) https://arxiv.org/pdf/2003.12783 […]
AdaShare:マルチタスク学習のための新しいアプローチ Computer Visionにおける効率的なマルチタスク学習のための新しいアプローチを提案。 各タスクをどの層を実行するかを選択するポリシ […]
Googleより発表されたWANN。 NW構造を固定し重みを最適化するのではなく、重みの学習なしで特定タスクを実行できるNN探索を行う点が特徴。 いくつかの強化学習タスク、教師あり学習(MNIST)で […]
Googleより発表された人の将来の経路・軌道を予測するアルゴリズムNextです。 (原論文:Peeking into the Future: Predicting Future Person Act […]