自作自演

Firefox の話題を中心に Web 関係の話も扱うつもりの雑記。だった。
zisakuzien.exblog.jp

Top

sort と uniq の結果が変だった。

1行1単語のファイルから、単語の数を集計しようとしました。
ところが。

uniq -c の結果がおかしい!
grep すると 1つしか見つからないのに、
uniq -c だと、その単語が 713 もあるって出てくる!なんなの!
よく見たらそもそも sort も並び順おかしい!同じ単語がばらばらの場所にある!

…とか思ったのですが、LC_ALL=C をつけたらうまくいきました。
問題になった環境では試せていませんが、LC_COLLATE=C で充分かもしれないです。
LC_ALL=C sort text.txt | LC_ALL=C uniq -c > result.txt

ロケールの確認は locale コマンドで。


■参考
Ubuntu日本語フォーラム / utf-8に対応したソートコマンドってありますか。

LC_ALL環境変数とsortコマンド - sileの日記
追記: sort を使うときは,LC_ALL=C を忘れずに - ny23の日記

1 Entry per Day: What's "LANG=C" ?Standard Locales - The GNU C Library

Linux Hacks:環境変数によるロケールの管理 (1/2) - ITmedia エンタープライズ
[PR]
by tokage-shippo | 2012-02-04 17:04 | その他
Mozilla Firefox ブラウザ無料ダウンロード

about this...

書き手の名前は 晴柳祐志 と言います。


リンク

Twitter
いつか何とかしたいサイト

最新のトラックバック

[foxkeh]フォクす..
from 「 Firefox ×?=!..
[Firefox]Fir..
from +Sun Flower〜報告〜+
Firefoxバトン
from MなMによるMのための日記
スキン変更!
from SUKA・SUKA・BLOG
Firefox 1.5に..
from mmkg

検索

S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
XML | ATOM

個人情報保護
情報取得について
免責事項