mixiのログイン機能についに画像認証システム「reCAPTCHA」が実装されました。
その結果、スクレイピングの技術を使って日記をまとめてバックアップするのが困難になりました。
mixi日記バックアップツールの中には、プロキシーサーバーを使ってまとめて日記をダウンロードする方法もあるようですが、不正とみなされてアカウント凍結になるリスクがないとは言い切れません。
2019年5月25日現在で最も安全に日記をバックアップ取る方法は、mixiも推奨している製本サービス「MyBooks.jp」です。
この日記では、スクレイピングを使った方法のバックアップのリスク、「MyBooks.jp」を使ったバックアップ方法について解説します。
スクレイピングを使った方法ではログインできなくなった
実際にpythonのスクレイピングでログインを試して見ましたが、ログインできませんでした。もしかしたら、実装方法が違っていたかもしれませんが、「reCAPTCHA」を導入から自動ロボットを制限しているからだと思います。
バックアップツールは使って問題ない?
mixi非公式ですが、日記バックアップツールがあります。これらは、スクレイピングの技術を使っています。
ツール自体は良いツールだと思います。
おそらく効率的にバックアップ作業ができると思いますが、懸念点があります。
バップアップツールの中には、画像認証システム「reCAPTCHA」対策ものもあります。ツールを使うと、100件の日記を5分でバックアップ(テキストのみ)という実体験もあります。たしかに、このあと紹介する製本サービス「MyBooks.jp」を使うよりも早くて効率的に使えるかと思います。
100件の日記を5分ということから、3秒間隔でサーバにアクセスすることになります。サーバーに負荷をかけているとは言い切れないですが、「この動きはBOTかな?」とmixiの運用担当者から思われるかもしれません。「reCAPTCHA」を導入するということは、自動ロボットはNGという意思表示にも思えます。
mixiが意図していない事をやると不正アクセスとみなされる、最悪、mixiにログイン出来ないことも想定されます。
なぜ、このような懸念をしているかというと、私は(mixiではないですが)ソーシャルゲームのサーバー運用担当をしていました。おかしなアクセスがあったら遮断していた背景もあるので、このような懸念を持ちました。
よって、mixi非公式のツールを使うことは、アク禁されるリスクがあることを知っておいた方が良いでしょう。
安全策をとるならmixiも推奨している製本サービス「MyBooks.jp」
安全に日記のバックアップを取るならば製本サービス「MyBooks.jp」を使うのがおすすめです。このサービスはSNSやワードプレスで書いた日記などを製本するサービスですが、製本するまえの確認段階で、mixiで書いてきた日記をpdfファイルとしてダウンロードできます。
製本サービス「MyBooks.jp」の特徴
・数カ月分のmixi日記をまとめてpdfにバックアップできる
・日記内の写真もpdfに含めることができる
・作成したpdfファイルを保存できる(ただし、すべてのページにsampleという文字の透かしが入る)
これらのことは無料で行うことができます。
製本する段階で有料になります。
「MyBooks.jp」の使い方を解説します
・mixiにログインします。
・mixi内の「日記を製本する」ページに行きます。
・「MyBooks.jp」のユーザー登録します(登録している場合は次に進みます)。
・登録後「MyBooks.jpのユーザー登録済みの方はこちら」をクリックします。
・利用同意をクリックします。
・「MyBooks.jp」のページに行きます。
・「本のタイトル」や「日記を読み込む範囲入力」して次に進みます。
・「編集中の本」画面に移ります。
・「仕上がり見本(PDF)の確認」ボタンをクリックします。
するとPDFをダウンロードできます。
「sampleという文字の透かしが入りますが、日記のバックアップを手に入れることができます」
毎日日記を書いている人だと、大体2ヶ月分で保存容量の限界に来てしまい、日記に含めたい部分を追加できません。
その場合は、再度編集し1ヶ月毎に区切るなど、pdfファイルをいくつかに分けてバックアップを試みてみましょう。
まとめ
いかがですか?
もし安全にバックアップを取りたいのであれば、mixi非公式のツールを使うよりも効率が悪かったとしても「MyBooks.jp」がオススメです。
バックアップが原因でmixiにログインできなくなったら元も子もないですから。