OS | Windows 10 64bit |
Python | 3.10.2 |
Faker | 13.14.0 |
Fakerは、様々な言語に対応したダミーデータを簡単に作成することができるPythonパッケージです。
ダミーデータは主にテストに活用されることが多いのではないでしょうか。例えば新規Webサービスのデータベースに架空の個人情報を挿入してテストするなどが考えられます。
本記事ではFakerのインストール方法から簡単に日本用のダミーデータ作成方法をいくつかご紹介します。
Shell
pip install Faker
以降、簡単に日本用のダミーデータ作成方法をご紹介します。
なお、下に挙げる出力例は全てランダムとなっており個人を特定するものではございません。出力を固定したい場合は、seedを与えることもできます。詳しくは、ドキュメントをご参照ください。
Python
from faker import Faker
fake = Faker("ja_JP")
住所は、都道府県や市区町村、番地、建物名などのパターンを生成できます。その一部を以下に載せます。
その他パターンについては、ドキュメントをご参照ください。
住所
Python
fake.address() # '青森県横浜市青葉区戸山15丁目23番9号 パーク虎ノ門虎ノ門ヒルズ森タワー464'
都道府県
Python
fake.prefecture() # '愛知県'
市区町村
Python
fake.city() # '富津市'
郵便番号
Python
fake.zipcode() # '467-1974'
名前は、姓や名、男性、女性、漢字、カナ、ローマ字など様々なパターンを生成できます。その一部を以下に載せます。
その他パターンについては、ドキュメントをご参照ください。
姓名(漢字)
Python
fake.name() # '木村 太一'
姓名(カナ)
Python
fake.kana_name() # 'ヤマダ マアヤ'
姓名(ローマ字)
Python
fake.romanized_name() # 'Yoichi Suzuki'
姓(漢字)
Python
fake.last_name() # '加藤'
名(漢字)
Python
fake.first_name() # '亮介'
名(漢字,カナ,ローマ字タプル)
Python
fake.first_name_female_pair() # ('七夏', 'ナナミ', 'Nanami')
Python
fake.phone_number() # '080-3995-8909'
ビジネス関係では、会社名、キャッチフレーズ、カテゴリなど様々なパターンを生成できます。その一部を以下に載せます。
その他パターンについては、ドキュメントをご参照ください。
会社名
Python
fake.company() # '有限会社斎藤食品'
カテゴリ
Python
fake.company_category() # '建設'
本記事ではダミーデータを作成するPythonライブラリFakerをご紹介しました。
pipでインストールでき、使い方も非常にシンプルです。本記事で紹介した以外にもバーコードやランダムテキストなども生成できますので、是非ご活用してみてはいかがでしょうか。
[…] Seleniumでよく紹介されている活用方法は、スクレイピングです。スクレイピングは、Webサイトやデータベースから特定の情報をかき集める行為です。機械学習やデータ分析で、データを収集するためにスクレイピングを使用する場面も多いはずです。活用方法はスクレイピング以外にも、Webテストのため、本ブログでも紹介したFakerを使ってダミーデータを生成し、SeleniumでWebページに自動入力や自動ログインという使い方もできます。 […]
I do consider all the ideas you have presented on your post.
They’re very convincing and will definitely work. Still, the posts are very brief for newbies.
Could you please extend them a little from subsequent time?
Thank you for the post.
I am not familiar with writing blog posts and this kind of feedback is very helpful.
I will try to write better posts.
Thank you for your advice!