NCVCの作者のページ

Python でワード分割してみる(Scriptorium経由で実行する場合)

Python でワード分割してみる(Scriptorium経由で実行する場合)

 Perlで組んだ時に標準入出力(リダイレクト)が渡せなかった記憶があったので,引数で入力ファイルと出力ファイルを渡したのかな? Pythonスクリプトも以下のように書き換える必要があります.ご参考に. ファイルをcloseしない行儀の悪い書き方です.


import sys
import re

inFile=open(sys.argv[1])
outFile=open(sys.argv[2], "w")

reg_ignore = re.compile(r'\W')
reg_word   = re.compile(r'[A-Z]-?\d+\.?\d*')

for line in inFile.readlines():
    if re.match(reg_ignore, line):
        print(line, end='', file=outFile)
        continue
    wordlist = re.findall(reg_word, line)
    for w in wordlist:
        print(w, end=' ', file=outFile)
    print('', file=outFile)
	

splitword_ARGV.py

<< 前のページに戻る