« 2019年5月 | トップページ | 2019年10月 »

2019年9月

2019.09.04

Shell ScriptとPOSIXコマンドで実践する簡単データ処理(その1)

以前、Shell Scriptとコマンドを使ったワンライナーで実践するデータ処理の記事を書きました。

ワンライナーで実践する簡単データ処理(その1 繰り返し項目集計編)
ワンライナーで実践する簡単データ処理(その2 疑似データベース編)

今回は、これらの記事に少し補足をしたいと思います。ここでは、繰返し項目処理と集計処理を取り扱います。
例に用いるデータは以下のとおり。タブ区切りテキストデータです。また、繰返し項目を” | ”で区切ります。
データ項目にスペースが入ることがある可能性を考慮して、ここでは項目区切り文字をタブに統一して取り扱います。 

list.txt


ID00001 f1ec 2013 IPC00 | IPC01 JP | US
ID00002 097d 2017 IPC02 US
ID00003 6a5b 2016 IPC03 | IPC04 | IPC05 JP | US | US
ID00004 6262 2015 IPC01 DE | EP
ID00005 8ab4 2014 IPC06 US
ID00006 3551 2016 IPC07 CN
ID00007 ca3e 2015 IPC03 | IPC08 | IPC09 CN | US
ID00008 af39 2014 IPC01 | IPC03 | IPC09 JP
ID00009 d168 2015 IPC10 JP | WO
ID00010 bc4f 2016 IPC11 | IPC01 CN | CN
ID00011 1efd 2016 IPC01 | IPC12 JP | WO
ID00012 2b22 2017 IPC13 | IPC14 | IPC15 | IPC16 DE | WO
ID00013 9776 2017 IPC04 | IPC15 US | JP | EP

4列目及び5列目が繰返し項目になっています。

続きを読む "Shell ScriptとPOSIXコマンドで実践する簡単データ処理(その1)"

| | コメント (0)

« 2019年5月 | トップページ | 2019年10月 »