ソフトウェア : Software

Twitterフォロワーの分析をしよう(9)

2019/12/01

Twitterフォロワーの分析をしよう(9)

Let’s analyze Twitter followers! (9)

让我们来分析Twitter的追随者!(9)

 

This contents is Japanese Only.

Twitterフォロワーの分析をしよう(1)

Twitterフォロワーの分析をしよう(2)

Twitterフォロワーの分析をしよう(3)

Twitterフォロワーの分析をしよう(4)

Twitterフォロワーの分析をしよう(5)

Twitterフォロワーの分析をしよう(6)

Twitterフォロワーの分析をしよう(7)

Twitterフォロワーの分析をしよう(8)

 

ここから先のやり方は、数が少なければ、全量をチェックするやり方があります。

しかし、Retarが抽出できたのは、621アカウントと現実的に全部見ると死んでしまいます。

やってみてわかりましたが、チェックできるのはせいぜい200アカウントまでです。

あとはタイムランで流れてきたら、即フォローを外すことにしました。

データ解析の基本は、不要なデータをそぎ落とすことと、統計情報のテーブルを作るのが基本です。

あとは、どう重みづけをして、効率よくデータ抽出できるかが、勝負です。

精度よくデータ分類できる方法は、いろいろあり、こうした技術に長けているかどうかが、解析者の能力です。

自動で抽出できるならそれに越したことがありませんが、

 

絞り込み作業

「TwitterAnalyzeToolKit\TWTimeLineCapt\Outs\Analysis002Counter」フォルダの「GRAYWORDSTATICS.csv」ファイルの編集を続けます。

今回は簡単な方法で調べます。

AC列を選択し、降順に並べ替えます。

chart1

 

「選択範囲を拡張する」を選択します。

chart2

 

並べ替え後の上位のアカウントはほぼ、「毒」アカウントであると言えます。

下の方ほど、善良アカウントの可能性が高まります。

Retarは、200上位以下では、ほぼ毒はないとわかったので、ここから上位200アカウントを調査して排除をすすめました。

ミスしたのは2-3件で、タイムラインに出てきたり、ダイレクトメッセージが来たので、排除できました。

chart3

 

実際の作業で抽出できたアカウントです。

白い部分が排除したアカウントです。

黄色はフォローするアカウントで、既にフォローの中のアカウントと、未フォローのアカウントです。

やはり、悪徳アカウントは「毒語吐きまくり~」がわかります。

chart4

 

フォローするユーザーファイルをつくる

現在は目的のデータまで到達しました。

あとはフォローしないアカウントをアンフォローし、フォローするアカウントをフォローするだけです。

ここからは実際のフォローに関わる部分なので慎重にお願いします。

chart5

 

はじめにフォローしないアカウントのリストを作ります。

「TwitterAnalyzeToolKit\Save\<日付>」フォルダを開き、「削除対象第一弾<日付>.csv」ファイルをコピーして、「アンフォロー対象<日付>.csv」ファイルにリネームします。

chart6

 

文字コードの問題があるので、コピーして対応します。

「TwitterAnalyzeToolKit\Save\<日付>」フォルダを開き、「善+悪.csv」をコピーして、<「フォロー対象<日付>.csv」ファイルにリネームします。

chart7

 

「アンフォロー対象<日付>.csv」ファイルと「フォロー対象<日付>.csv」ファイルを同時に開きます。

chart8

 

「アンフォロー対象<日付>.csv」ファイルの内容を全て一旦削除して一旦保存します。

このまま、「アンフォロー対象<日付>.csv」ファイルと「フォロー対象<日付>.csv」ファイルを開いたままにします。

chart9

 

追加したいアカウントのユーザーIDを「フォロー対象<日付>.csv」ファイルに追加し、フォローしたくないアカウントを追加してください。

既にフォロー、アンフォローになっていても関係なく、強制的にフォロー状態はファイルの支持に従い実行されます。

編集が終わったら保存して終了します。

chart10

 

アンフォロー対象を処理する

実際のフォローに関わる部分なので慎重にお願いします。

「TwitterAnalyzeToolKit\Save\<日付>」フォルダから「アンフォロー対象<日付>.csv」を「TwitterAnalyzeToolKit\TWCreateAndDestroy」フォルダにコピーします。

chart11

 

「TwitterAnalyzeToolKit\TWCreateAndDestroy」フォルダにある「sg.ini」

ファイルを編集します。

Twitter APIから4か所のキーを入力し、「parm_screen_name」のアカウントを自分に(ここではRetarになっていますが、自分のアカウントしか操作できません)、「sleeptime」は2000のままで、「GetUserListFile」を「アンフォロー対象<日付>.csv」のファイル名にして、「GetFriendshiptype」を「Destroy」にします。

編集が終わったら、保存して終了します。

詳しくは以下で。

https://github.com/devel-retar-jp/TWCreateAndDestroy/blob/master/TWCreateAndDestroy/sg.json

chart12

 

ここからは本当にアンフォローされます。

既にアンフォローの人はそのままです。

「TwitterAnalyzeToolKit\TWCreateAndDestroy」フォルダにある「TWCreateAndDestroy.exe」をダブルクリックして実行します。

ブラウザでフォロワーが減っていくのを確認してください。

chart13

 

フォロー対象を処理する

実際のフォローに関わる部分なので慎重にお願いします。

「TwitterAnalyzeToolKit\Save\<日付>」フォルダから「フォロー対象<日付>.csv」を「TwitterAnalyzeToolKit\TWCreateAndDestroy」フォルダにコピーします。

chart14

 

「TwitterAnalyzeToolKit\TWCreateAndDestroy」フォルダにある「sg.ini」

ファイルを編集します。

Twitter APIから4か所のキーを入力し、「parm_screen_name」のアカウントを自分に(ここではRetarになっていますが、自分のアカウントしか操作できません)、「sleeptime」は8000にしてください、「GetUserListFile」を「フォロー対象<日付>.csv」のファイル名にして、「GetFriendshiptype」を「Create」にします。

編集が終わったら、保存して終了します。

詳しくは以下で。

https://github.com/devel-retar-jp/TWCreateAndDestroy/blob/master/TWCreateAndDestroy/sg.json

chart15

 

ここからは本当にフォローされます。

既にフォローされている人はそのままです。

「TwitterAnalyzeToolKit\TWCreateAndDestroy」フォルダにある「TWCreateAndDestroy.exe」をダブルクリックして実行します。

ブラウザでフォロワーが増えていくのを確認してください。

 

以上でフォロワーの整理が完了です。

 

今回で「Twitterフォロワーの分析をしよう」の最終回となります。

長い長い説明にお付き合いくださいまして、ありがとうございました。

 

相場分析のリクエストがありましたら“Contact Us”からお知らせください。ご要望にお応えできるように努力いたします。

このブログはあくまでも個人的な見解であり、投資判断は各自でお願い致します。当ブログは一切の投資損益に対する責任を負いません。

ブログに来て下さってありがとうございます。明日もよろしくお願いいたします。

If you have some request to analyze, please write to “Contact Us”.

We do best effort for your request.

These are only personal opinions on this blog, and you need the investment judgment in each one. This blog doesn’t assume the responsibility to all the investment profit and loss.

Thank for watching our contents. My best regards next day.

如果您需要行情分析,请点击“Contact Us”联系我们。我们将尽力满足您的要求。

本博客仅为个人意见,请各自做出投资判断。本博客概不对任何投资盈亏负责。

感谢您访问本博客。欢迎再次使用。


Twitterフォロワーの分析をしよう(8)

2019/11/30

Twitterフォロワーの分析をしよう(8)

Let’s analyze Twitter followers! (8)

让我们来分析Twitter的追随者!(8)

 

This contents is Japanese Only.

Twitterフォロワーの分析をしよう(1)

Twitterフォロワーの分析をしよう(2)

Twitterフォロワーの分析をしよう(3)

Twitterフォロワーの分析をしよう(4)

Twitterフォロワーの分析をしよう(5)

Twitterフォロワーの分析をしよう(6)

Twitterフォロワーの分析をしよう(7)

 

昨日までのデータ整理作業で良い所まで、データを削り込むことができました。

吟味したのは「TwitterAnalyzeToolKit\Save\<日付>」フォルダにある5052アカウント。

削除対象にできたのは、4190アカウントです。

検査しないといけないアカウントは5052-4190=862アカウントです。

 

現在の状況

現在の状況は、灰色の部分を「削除対象第一弾<日付>.csv」ファイルにまとめることができています。

フォローしたいのは「善良なアカウント」だけです。

しかし、EAポエマー、アフリエータが紛れています。

これらを排除するためにリストを作成していきます。

chart1

 

「善と悪」の「マゼマゼ」ファイルを作成

「TwitterAnalyzeToolKit\TextMarger\IN」フォルダに「TwitterAnalyzeToolKit\Save\<日付>」フォルダから「削除対象第一弾<日付>.csv」「両思い+片思い+片思われ<日付>.csv」ファイルをコピーします。

chart2

 

「TwitterAnalyzeToolKit\TextMarger」フォルダを開き、「TextManager.exe」をダブルクリックして実行します。

「OUT」フォルダが作成されてきます。

chart3

 

「TwitterAnalyzeToolKit\TextMarger\OUT」フォルダを開きます。

4ファイルができていますが、「両思い+片思い+片思われ20191107_ORG.csv」が目的ファイルです。

chart4

 

「両思い+片思い+片思われ<日付>_ORG.csv」ファイルを「善+悪.csv」にリネームします。

chart5

 

「TwitterAnalyzeToolKit\Save\<日付>」にコピーします。

chart6

 

「善+悪.csv」からタイムラインのまとめファイルを作成

「TwitterAnalyzeToolKit\TWTimeLineCapt\Outs」フォルダを開きます。

不要なファイルを削除します。

「UserTimeRunJSON」フォルダ、「IDSIN」フォルダを残し、それ以外のファイルとフォルダを削除します。

chart7

 

「TwitterAnalyzeToolKit\TWTimeLineCapt\Outs\IDSIN」フォルダを開き、残っているファイルがあれば削除します。

「TwitterAnalyzeToolKit\Save\<日付>」フォルダから「善+悪.csv」ファイルをコピーします。

chart8

 

「TwitterAnalyzeToolKit\TWTimeLineCapt」フォルダに移動します。

chart9

 

「sg.ini」ファイルを編集します。

確認する場所に赤線を引いています。

今回は6時間半かけてダウンロードした編集前の状態です。

chart10

 

書き換え後の状態です。

「twFriendsIdsGets」をfalse、「twTimeLineGets」をfalseにします。

編集が終わったら、保存します。

chart11

 

「TWTimeLineCapt.exe」ファイルをダブルクリックして実行します。

chart12

 

残りの排除対象は、活発な業者、アフリエータのみ。

実行して分析できたのは、「ただいま吟味中」となる「活発で善良なるアカウント」と「業者・アフリ」の集合です。

この中にはフォローしたとたんに、広告ダイレクトメッセージを送ってくる輩もいます。

逆にTwitterを草刈り場にしている「活発な業者・アフリ」とも言えるので、即返信が帰ってきます。

chart13_conv

 

毒語から善良ユーザを仕分ける。

「TwitterAnalyzeToolKit\TWTimeLineCapt\Outs\Analysis002Counter」フォルダを開きます。

chart14

 

「GRAYWORDSTATICS.csv」ファイルをExcelで開きます。

622行あります。

862アカウントを分析しましたが、見出しがあるので621アカウントまで調査対象を絞り込むことができました。

862-621=241アカウントは善良なユーザか、日本語以外のアカウントです。

chart15

 

データの意味は各アカウントがどれだけ、「毒語」(業者、アフリエータが良く使う用語)を呟いているかの統計情報です。

例えば上から3行目のSCREENNAME「~HTO」のアカウントは、直近21の呟きの中で「無料」という単語を3回、「お金」という単語を2回、「情報」と言う単語を3回など、どの単語を何回呟いたかがわかります。

AC列には、その集計があり、このアカウントの場合の「毒語」は21の呟きの中で、27回あったことがわかります。

AD列はアカウントのURLが入っています。

chart16

 

「毒語」は業者アカウント100件をRetarで集計してつくりました。

善良なアカウントがあまり普段は呟かない特徴的な単語です。

業者、アフリはモノを宣伝したいので何度も呟きます。

また、左から特に頻度の高い「毒語」の順番に並べています。

 

続きは、また次回に・・・。

 

相場分析のリクエストがありましたら“Contact Us”からお知らせください。ご要望にお応えできるように努力いたします。

このブログはあくまでも個人的な見解であり、投資判断は各自でお願い致します。当ブログは一切の投資損益に対する責任を負いません。

ブログに来て下さってありがとうございます。明日もよろしくお願いいたします。

If you have some request to analyze, please write to “Contact Us”.

We do best effort for your request.

These are only personal opinions on this blog, and you need the investment judgment in each one. This blog doesn’t assume the responsibility to all the investment profit and loss.

Thank for watching our contents. My best regards next day.

如果您需要行情分析,请点击“Contact Us”联系我们。我们将尽力满足您的要求。

本博客仅为个人意见,请各自做出投资判断。本博客概不对任何投资盈亏负责。

感谢您访问本博客。欢迎再次使用。


© 2019 Retar