« 2018年5月 | トップページ | 2018年10月 »

2018年9月

2018.09.22

ワンライナーで実践する簡単データ処理(その2 疑似データベース編)

この記事は、ワンライナーで実践する簡単データ処理(その1 繰り返し項目集計編)の続きです。

前回作成したtemp01.txtはこのようなファイルでした。


WOS:000207567300006 [Goldfarb, Donald] Columbia Univ, Dept Ind Engn & Operat Res, New York, NY 10027 USA
WOS:000207567300006 [Osher, Stanley; Darbon, Jerome] Univ Calif Los Angeles, Dept Math, Los Angeles, CA 90095 USA
WOS:000207567300006 [Yin, Wotao] Rice Univ, Dept Computat & Appl Math, Houston, TX 77005 USA
WOS:000207567500003 [Wang, Yilun; Yin, Wotao; Zhang, Yin] Rice Univ, Dept Computat & Appl Math, Houston, TX 77005 USA
WOS:000207567500003 [Yang, Junfeng] Nanjing Univ, Dept Math, Nanjing 210093, Jiangsu Prov, Peoples R China
...

ですが、著者の項が繰り返し項目になっているため、アクセッション番号、所属機関、所属機関の国籍/地域、著者のテーブルに加工してみましょう。

続きを読む "ワンライナーで実践する簡単データ処理(その2 疑似データベース編)"

| | コメント (0) | トラックバック (0)

2018.09.19

ワンライナーで実践する簡単データ処理(その1 繰り返し項目集計編)

テキストファイルからなるデータの集計を取るとき、shellを使ってやると手早く処理することができます。

Perlで同じことができるのは当然ですが、時にはshellとコマンドを組み合わせた方が手軽なこともありますよね。今回は、その小技を忘れないようにメモ。

例として、論文の著者の所属機関の国籍(または地域)を集計する場合を考えます。共同研究の場合、1論文の著者は複数機関に亘ることになります。元データはWeb of Scienceの検索結果をexportしたもので、以下のようなタブ区切りのテキストファイルsavedrecs_0001_2440.txtです。


... C1 ... UT ...
... [Yin, Wotao] Rice Univ, Dept Computat & Appl Math, Houston, TX 77005 USA; [Osher, Stanley; Darbon, Jerome] Univ Calif Los Angeles, Dept Math, Los Angeles, CA 90095 USA; [Goldfarb, Donald] Columbia Univ, Dept Ind Engn & Operat Res, New York, NY 10027 USA ... WOS:000207567300006 ...
... [Wang, Yilun; Yin, Wotao; Zhang, Yin] Rice Univ, Dept Computat & Appl Math, Houston, TX 77005 USA; [Yang, Junfeng] Nanjing Univ, Dept Math, Nanjing 210093, Jiangsu Prov, Peoples R China ... WOS:000207567500003 ...
...

C1は著者の所属の繰り返し項目です。UTはアクセッション番号、要するに主キーです。
まず、主キーUTと繰り返し項目C1を正規化してやります。

続きを読む "ワンライナーで実践する簡単データ処理(その1 繰り返し項目集計編)"

| | コメント (0) | トラックバック (0)

2018.09.16

Mac mini Early 2009にHigh Sierraをインストールしてみる

私が所有しているMac mini Early 2009は、OSがEl Capitanまでしか対応しておらず、そろそろ次の機種が欲しいところ。しかし、現行Mac miniが2014年10月に発売されて以来、実に4年近く新機種が出ておりません。新機種の噂は出ているので、もうしばらく発表を待って、次期購入機種を検討しようと思っています。

しかし、購入までは、残念なことに、最近のOSを試すことができない…
すると、なんと、Macの非サポート機種にHigh Sierraをインストールするパッチがありました。
サポート対象外のMacに「macOS High Sierra」をインストールした【iMac Early 2008】:ringocat note
ありがとうございます。

当然、インストールは自己責任ですが、まあ、10年前に買った機種ですし…ね。
ちなみに、我が家のMac mini Early 2009は、メモリ増設と内蔵HDDのSSD化を実施済みです。
Mac mini Early 2009 のHDDをSSDに換装&メモリを8GBに増設:tonopぶらり

続きを読む "Mac mini Early 2009にHigh Sierraをインストールしてみる"

| | コメント (0) | トラックバック (0)

« 2018年5月 | トップページ | 2018年10月 »