Never Too Late

いつだってゼロからやり直そう

scikit-learn/scipyを使い、コサイン類似度ベースで階層型クラスタリングをするときのメモ

scikit-learn, scipyを使い、文章をコサイン類似度を用いて階層型クラスタリングを行おうとしたときに少し詰まったのでメモです。 まずは以下のような文章を用意します。Chat GPTに作らせたそれぞれバスケットボール、野球、交通渋滞に関する50単語のニュー…

Google BigQuery MLを使ってみたけど、これが便利に使えるシーンが分からない

野暮用でGoogle BigQueryを勉強し始めました。そしてBigQueryは機械学習をサポートしているというので早速少し使ってみました。「SQLと機械学習」と聞くとどこか奇妙な組み合わせのような響きですが、機械学習は大抵データフレームを使ってモデルを作り、そ…

データ仕事をRからPythonに乗り換えるときのあれこれメモ

ずっとデータの仕事をRで行っていたのですが、思い立ってPythonに乗り換えることにしました。Pythonという言語自体には以前から定期的に使っていたこともあり全く抵抗はありませんが、以降に際して乗り越えなければならない大きなハードルが大きく分けて4つ…

ビットコイントランザクションのインプットを見てみる

(2017年10月6日にQiitaにて執筆した記事をこちらに転載しています。) 前回やったこと 前回の記事ではあるひとつのビットコイントランザクション(誰かが堀江貴文さんにビットコインを送ったときのもの)に着目し、内容を詳しく見ていきました。 今回はその…

ビットコイントランザクションの中身を詳しく見てみる

(2017年10月3日にQiitaにて執筆した記事をこちらに転載しています。) 前回やったこと 前回の記事では堀江貴文さんのビットコインアドレスを例に、あるビットコインアドレスに関連するトランザクションの一覧を取得しました。 今回はその中のひとつのトラン…

ブロックチェーンからあるビットコインアドレスのトランザクション情報を取得する

(2017年9月25日にQiitaにて執筆した記事をこちらに転載しています。) ホリエモンこと堀江貴文さんはTwitterのプロフィール欄にて投げビットコインアドレスをひとつ公開しています。 今回はこのビットコインアドレスを例として使わせてもらい、ブロックチェ…

ビットコインアドレスを自分の手で作って理解する

(2017年10月21日にQiitaにて執筆した記事をこちらに転載しています。) はじめに この記事ではビットコインで使われているビットコインアドレスを自分の手で作る手順を紹介しています。ビットコインアドレスを作ることを通して、ビットコインに対する技術的…

Power BIでLOOKUPVALUEを使い、同じテーブルの別の列を参照する

(2018年2月24日にQiitaにて執筆した記事をこちらに転載しています。) 以下のようなデータがあるとします。Filesと名付けます。 各行のParentIdはそのレコードの親となるレコードのIDを指しています。つまりこのデータは、自分自身を参照しています。 この…

3 ÷ 4 ≡ 9 mod 11を計算するのに必要なモジュラ逆数を理解する

(2017年10月17日にQiitaにて執筆した記事をこちらに転載しています。) 経緯 暗号通貨の技術に興味を持っていまして、勉強の為に1からビットコインアドレスを自分で作ってみようと思ったのですが、いきなり躓いたところがあったので共有したいと思いました…

ggplot2を使ってガントチャートを描く

ggplot2を使ってガントチャートを描いてみます。ガントチャートは、プロジェクトを進行する際の複数タスクの関連を図示するとき等によく使われるチャートです。 まずこのようなデータフレームを用意します。 Task Date Type A 2020-01-01 Start A 2020-01-05…