Pythonの正規表現モジュール(re)が提供するre.findall関数を使って、文字列からパターンにマッチした部分を抽出する方法を紹介する。同様な処理を行うre.finditer関数も取り上げる。
(2021/03/05)
日立は、「日立指静脈認証装置C-1」と、PCカメラ向け生体認証ソフトウェア開発キット「日立カメラ生体認証 SDK for Windows フロントカメラ」を2021年3月9日に提供開始する。非接触型生体認証機器で、本人確認やキャッシュレス決済などに向ける。
(2021/03/04)
分類問題で使える主要な評価関数をまとめ、使い分け指針を示す。具体的には二値分類用の「LogLoss」「AUC」「PR-AUC」を、さらに多クラス分類用の「正解率」「LogLoss」を説明する。
(2021/03/04)
経済産業省は、「AI・データサイエンス人材育成に向けたデータ提供に関する実務ガイドブック」を公開した。データ提供側とデータ受け取り側それぞれの課題について、契約ひな型を基に論点を解説して、考え方を示した。
(2021/03/03)
IDCは2021年2月23日、全世界の人工知能(AI)市場について、予測を発表した。AIソフトウェアやAIハードウェア、AIサービスを含む調査であり、「Worldwide Semiannual Artificial Intelligence Tracker」により詳しい報告をまとめた。
(2021/03/02)
Pythonで文字列から部分文字列を抽出する幾つかの方法の中から、基本的といえるインデックス指定やスライス指定を行う方法を紹介する。
(2021/03/02)
AWS活用における便利な小技を簡潔に紹介する連載「AWSチートシート」。今回は、AWSのAI音声合成サービス「Amazon Polly」をPythonで利用します。
(2021/03/02)
アクセンチュアは、世界の技術トレンドに関する調査レポート「Accenture Technology Vision 2021」を発表した。同社は、技術を駆使して変化を巧みに取り入れる企業が未来をけん引すると予測する。
(2021/03/01)
isalnumメソッドとisasciiメソッドと組み合わせて、あるいは正規表現を使って文字列が半角英数字のみで構成されているかどうかを調べる方法を紹介する。
(2021/02/26)
人気過去連載を電子書籍化して無料ダウンロード提供する@IT eBookシリーズ。第76弾では「作って試そう! ディープラーニング工作室」の第10回までをまとめました。自分でコードを書いたり、実行したりしながら機械学習やディープラーニングの基本的な考え方を理解していきましょう。
(2021/02/24)
Microsoftの「Azure Cognitive Services」に含まれる「Computer Vision」のOCR機能が、日本語を含む73言語に対応した。複数ページあるドキュメントから選択ページに限ってテキストを抽出できる。
(2021/02/19)
青空文庫から取得した梶井基次郎の著作データをMeCabで分かち書きしたものを基に、マルコフ連鎖と呼ばれる手法を用いて文を生成してみます。
(2021/02/19)
統計学や機械学習で使われるさまざまな確率分布のうち、連続分布の例として正規分布とベータ分布について見ていく。また、最近主流になりつつあるベイズ統計の関係についても簡単に紹介する。
(2021/02/18)
分類や推定・予測など、機械学習のさまざまな手法の基礎をなす「確率と統計」における「確率分布」とはどのようなものか。離散分布や連続分布といった種類に分けられるが、その一つである離散分布の例としてベルヌーイ分布と二項分布について見ていく。
(2021/02/17)
正規表現を扱うためのreモジュールのfullmatch関数などを使用して、文字列が数字だけで構成されているかどうかを判定する方法を紹介する。
(2021/02/16)
カリフォルニア大学サンディエゴ校の研究チームは、AIをだます新しい手法とその実証結果を発表した。実際の映像を改変操作したディープフェイク動画を検出するAIが対象だ。
(2021/02/15)
isdecimalメソッドを使って、文字列が数字だけで構成されているかどうかを判定する方法を紹介。isdigit/isnumericメソッドとの違いも取り上げる。
(2021/02/12)
用語「身体性」について説明。物理的に身体が存在することによる効果を論じる問題を指す。現状のコンピュータ/人工知能は必ずしも身体性を有していないので、人間と同じようには知能を獲得できないとされる。
(2021/02/10)
文字列の値を数値に変換する前に、それが変換できるかを調べる必要がある。例外を使ってこれを調べる方法と正規表現を使う方法の2つを紹介する。
(2021/02/09)
4つの人気クラウドプラットフォームで手軽に利用できるオープンなデータセットの一覧ページである「Registry of Open Data on AWS」「Azure Open Datasets」「Google Cloud 一般公開データセット」「IBM Developerの『データセット』カテゴリー」を紹介する。
(2021/02/08)
形態素解析エンジン「MeCab」をGoogle Colab上にインストールして、簡単なテキストを解析したり、分かち書きをしたりできるようにしてみる。
(2021/02/05)
サテライトオフィスは、業務用音声サービス「サテライトオフィス・音声でチャット機能 for Zeeny Pro」の提供を開始する。スマートフォンを手で操作せずに、音声で「LINE WORKS」などのチャットツールを利用できる。
(2021/02/04)
東京医科歯科大学と富士通は、新型コロナウイルス感染症に向けたAIの有効性を検証する。胸部X線写真から罹患状況を判定するAIや、診療情報に基づいて重症化を予測するAI、治療に伴う看護師の業務量を予測するAIの3種類を用いる。
(2021/02/03)
用語「シンボルグラウンディング問題」について説明。記号(言葉)が実世界の意味に結び付いているかを論じる問題を指す。現状のコンピュータ/人工知能は必ずしも結び付いておらず、言葉を理解していないとされる。
(2021/02/03)
NTTデータは、Microsoftと連携し、インドの医療診断機会が乏しい地域で結核診断を受診できるようにする。AI画像診断技術を適用した検診車と「Microsoft Azure」を活用して、インドのチェンナイの住民に対して結核診断を提供する。
(2021/02/02)
文字列のisalphaメソッドを使うとそれが英字のみで構成されているかどうかを調べられる。その使い方と注意点、正規表現を使って同様な処理を行う方法を紹介する。
(2021/02/02)
最近注目を集めている“Kaggler採用枠”やKaggler社内ランク制度の実態はどのようなもので、それによってどのようなメリットがあるのか。実際にKaggler制度を運用する企業の代表者やその制度の下で働くKagglerたちの意見を聞いてみよう。
(2021/02/01)
機械学習を使って文章の自動生成を行う準備として、青空文庫から小説のデータを取得して、本文のテキストを1文ずつリストに格納してみましょう。
(2021/01/29)
NTTデータとNTTデータ経営研究所は、「仮想脳モデル」を活用して動画広告を作成し、効果を検証した。再生率が23.6%、動画広告のツイートに関するエンゲージメント率が35.3%向上した。
(2021/01/28)
異音検知のプラットフォームを開発する際に、リサーチャとソフトウェアエンジニアでどのようなMLOps体制を組んだのか。また、そこでは何が課題となったのか。MLOps導入の参考にしてほしい。
(2021/01/27)
Pythonには文字列の内容を中央/左/右にそろえたり、0埋めを行ったりするためのメソッドがある。それらの使い方を紹介する。
(2021/01/26)