5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

自然言語とプログラミング技術

1 :デフォルトの名無しさん:2001/07/21(土) 20:19
自然言語でまともな文書を書くことできないのに、まともなプログラムなら書くことが
出来る。こんな器用な人がいるのでしょうか?

「は」と「が」の使い分けが出来なかったり、句読点をちゃんと打つことが出来ない。
こういう人は文書に構造を持たせる事が出来ないので、プログラムにも階層的な構造を
持たせたり、そのような考え方をすることが出来ないのだと思います。

どう思いますか。

2 :デフォルトの名無しさん:2001/07/21(土) 20:20
はい、その通りですね。

■■■■■■■■ 終了 ■■■■■■■■

むやみにスレたててるんじゃねー

3 :デフォルトの名無しさん:2001/07/21(土) 20:28
>>1
私のよう、な低脳が書いたプログラムでもコン
パイラをエラーがはじき出してくれ。
るので大丈夫です、

文章が間違っていたらコンパイルエラーがでる
閲覧ソフトを作ってください。

4 :デフォルトの名無しさん:2001/07/21(土) 20:33
夏はこの手のが増えますな〜。

5 :デフォルトの名無しさん:2001/07/21(土) 20:33
>>1
ガイジンなら「は」と「が」の使い分けが出来なかったり、
句読点をちゃんと打つことが出来なくてもイケてると思うが
どぉ?

6 :デフォルトの名無しさん:2001/07/21(土) 20:41
なんだ
自然言語処理関連のスレかと思ったら違うのか

7 :1:2001/07/21(土) 20:43
>>5
「ガイジン」というのは、「日本語を話さない人達」を指している
のでしょうか。確かにその人達からすれば「は」と「が」の
使い分けは必要ないでしょう。しかし他の自然言語にも同じような
「使い分け」があると思います。

8 :デフォルトの名無しさん:2001/07/21(土) 21:00
「目にものを見せてやる!」
と言って角膜移植手術を成功させる医者。

あ、あなたと私の意見がスレ違い。

「頭が痛い」「違う頭"が"痛いのではない!心で痛いのだ!」

9 :深い意味はない:2001/07/21(土) 22:10
てにおは64アウトライ〜〜ン♪

10 :深い意味はない:2001/07/21(土) 22:10
s/お/を/
鬱氏

11 :デフォルトの名無しさん:2001/07/21(土) 22:42








12 :デフォルトの名無しさん:2001/07/21(土) 22:43
>>6
俺もそう思って覗いてみたら激失望。
自然言語処理のスレ別に立てるか?

13 :デフォルトの名無しさん:2001/07/21(土) 22:52
カーナビとかで、口でしゃべって目的地設定とかできるのは
あれは自然言語処理が何かが関係ありなのですか?
(ややマジ)

14 :3:2001/07/21(土) 23:04
>>8
いいですね・・・
哲学板の人ですか?

15 :デフォルトの名無しさん:2001/07/22(日) 00:08
俺が村ではいまワープロの使うが流行してるよ。
みんなが村ではいま何を流行してるか?

16 :デフォルトの名無しさん:2001/07/22(日) 00:10
aeiou

17 :デフォルトの名無しさん:2001/07/24(火) 13:08
駄スレリサイクル化でもいいですよ。
最近この辺を研究中。

18 :デフォルトの名無しさん:2001/07/24(火) 13:26
んじゃマトモな自然言語処理スレに仕立て直すために
まず >>17 の研究ネタを書いてくれ。

19 :デフォルトの名無しさん:2001/07/24(火) 13:43
インターネット上の資料が少なくない? 自然言語処理の関係って。
あまり盛んでないのか?

20 :デフォルトの名無しさん:2001/07/24(火) 14:11
プログラムは思いどおりに動いてくれるが部下は
全然思いどおりには動いてくれない。
自然言語でプログラミングなんつったらプログラムも
思いどおりには動いてくれなくなっちゃうんかな。

21 :デフォルトの名無しさん:2001/07/24(火) 14:24
漏れは>>1のテーマはそれなりに面白いと思えるんでレスる。
#########ただ、スレタイトルは失敗だったとは、俺も思うが。

で。>>1の意見は、ある程度は当たっていると思うが、
1つ重要な点を見逃しているように思える。
それは、日本語「が」ドキュ言語だ、という面についてだ。

「てにをは」といっても、それをぐちゃぐちゃにしても
なお意味が通じてしまうっていう辺りが、厳格な言語とは
比較にならない使いにくさなわけだし、その曖昧さを敢えて
計算機言語世界に持ち込もうと一部の連中が言っているが、
あれはぜひ絶滅して欲しいと思う。

同様に、本来の意味のいわゆる自然言語を計算機で扱うっていうのにも
あんまり良い感じはしないなあ。
「口で喋れる計算機向けscript(ってのか?とにかく簡単な)言語」
を作ることとかを考えるほうが、ずっと生産的だと思う。
勿論その言語は簡単ではあっても厳格な言語として設計してくれ。
そういう言語の前例はあるぞ。例えば盲導犬とかを制御する言語な。
計算機なんて犬並み(かそれ以下)だろ。フルスペックの
人間様用言語なんて食わせるのは無駄。
まぁ自然言語を計算機じゃなく人間様のために
処理する(たとえば機械翻訳)という仕事は必要だが。

あと句読点の類。1つの文に複数の点が出現するが、
それらの間には結合(というか区切り)の強さの「差」が
有るように感じることがある。演算子の優先順位と同じ意味で。
にも関わらず、日本語の語彙としての点は、たったの2種類
(いや、文"中"に使える点は1種類だけ)なので、
演算子と違って使い分けが効かない。

ここは一発、記号の種類が多数用意されていなくても
階層的な構造を無理なく表現できる手段、つまり
「括弧」によって、日本語を記述したほうが
いいんじゃねーか?と、思う。

いや、どうせ使い物にならん言語として
改良なんかせずに捨てる、という手もあるがな(わら

22 :デフォルトの名無しさん:2001/07/24(火) 14:31
> 漏れは>>1のテーマはそれなりに面白いと思えるんでレスる。

プログラミング言語は計算式のお化け。理系の数式。
自然言語のセンスとは違う。プログラムのコメントは
わかりやすい言葉で書いて欲しいものだが。

23 :17:2001/07/24(火) 16:14
まだ、始めたばかりだから大したことは言えないんだけど、
テキストの全文検索を高速に行う手法で
suffix arrayというのがあります。
それがどういうものかというと・・・続く(?)

24 :デフォルトの名無しさん:2001/07/24(火) 16:17
>>21
>「てにをは」といっても、それをぐちゃぐちゃにしても
>なお意味が通じてしまうっていう辺りが、厳格な言語とは

意味が通じちゃまずいのか?

a++;
++a;
a += 1;
a = a+1;
a -= -1;
a = a-(-1);

プログラミング言語でも全部書き方は違うが意味は同じ。
結局そういうのは些細なことに過ぎん。

>を作ることとかを考えるほうが、ずっと生産的だと思う。

純粋な研究は生産性に関係なく楽しいか否かで行うだろ。
あんた趣味を決めるときに生産性を考えるのか?

25 :デフォルトの名無しさん:2001/07/26(木) 16:34
趣味で研究されたら堪らんなあ
ある程度の生産性が見込めると判断して、企業も国も金を出して欲しい
(企業は実際そうなんでしょうけど)

そいつが個人で勝手に作って、個人で使うなら構わんけど

26 :デフォルトの名無しさん:2001/07/27(金) 03:50
ageてみる

27 :デフォルトの名無しさん:2001/07/27(金) 04:38
お。piza2出現っすか。

>>25
研究そのものは、金ベースじゃ辛いっすよ。
研究するくらいなんだから、「あたる」かどうかは
研究してみないと判らないのだから。
そんなこと言ってるから基礎技術が蓄積しないんだ、という面もあり。

ruby作者もアレしてた、未踏なんたらプロジェクト
ってのも有ったよな。あんな感じでまたーりで良いのでは?

少なくとも糞役人をはべらすよりは、成果が上がるかも知れない
という程度の意味で、たとえ片手間でも「研究」のほうがマシ。

28 :デフォルトの名無しさん:2001/07/27(金) 12:58
siffix arrayの続き。
siffix arrayとは、全文字へのポインタを保存しておくものです。
2ちゃんねる という文字列があったら、
01 2 3 4 5 という(ここでは相対的ですが)番地がつきます。
これを、文字列として取り出してみると、
0: 2ちゃんねる
1: ちゃんねる
2: ゃんねる
3: んねる
4: ねる
5: る
となります。続く。

29 :デフォルトの名無しさん:2001/07/27(金) 13:03
相対番地がずれましたが、続き。
そして、その文字列をソートしてやると、以下のようになります。
0: 2ちゃんねる
1: ちゃんねる
4: ねる
2: ゃんねる
5: る
3: んねる
これで何がうれしいか?というと、全文検索が非常に早くなります。
ポインタの保存にO(n)、ソートにO(nlogn)、
検索はバイナリサーチを使用できるのでO(logn)です。
今回のケースでは、最初の文字が重なるものが無かったのですが、
もしあった場合、関連するものをまとめて取り出すことが可能です。

1,2回程度しか検索しない場合には、普通の線形サーチすればいいのですが、
何度も何度も検索したいときには有効ではないでしょうか?

30 :デフォルトの名無しさん:2001/07/27(金) 14:06
自然言語age

31 :デフォルトの名無しさん:2001/07/27(金) 14:46
>>29
Suffix array は汎用のデータ構造で、別に自然言語処理
のネタだとは思わんが。
だいたい、それであんたは何を研究してんのよ。

32 :デフォルトの名無しさん:2001/07/27(金) 18:13
そこまで言うつもりは無いです。

33 :デフォルトの名無しさん:2001/07/27(金) 22:45
SUFARY
http://cl.aist-nara.ac.jp/lab/nlt/ss/
が有名やね。検索エンジンにも使われている。

検索のキャッシングでもするの?

34 :デフォルトの名無しさん:2001/08/09(木) 23:03
形式意味論
http://mentai.2ch.net/test/read.cgi?bbs=gengo&key=957016423

Functionalist vs. Formalist
http://mentai.2ch.net/test/read.cgi?bbs=gengo&key=995798510

言語学板には他にも面白そうなのはあるけど、クソスレ率も高いから
気をつけてください。

35 :デフォルトの名無しさん:2001/08/14(火) 19:43
なんか罵り合いばっかり>言語板
学術板とも思えなかった。

36 :デフォルトの名無しさん:01/08/26 21:58 ID:hZAvmIX2
>>29
>>31-33 あたり。
くだらない始まり方したスレでなにまじめにやってるんだか(w
といいつつつきあってみる漏れage。

たしかに"自然"言語専用のデータ構造じゃないわな。
Suffix arrayの解説終わったらついでにdouble array trieの説明もキボン。

日本国文法の「法」は計算機処理に耐えるほど体系的に整理されとらん。
まぁ自然言語だからしかたないがな。
なんでルールより辞書が大事。

>>1 よ。
自然言語のまともな文章を論理的に説明できるか?
自然言語のデバッガ作れたら漏れにくれよ。

37 :デフォルトの名無しさん:01/08/27 03:06 ID:Ld.vANXU
>>36
仕様に未定義や不定、実装依存が多すぎて使い物にならないのでは…。

38 :Seisei_Yamaguchi:01/09/02 20:33 ID:/pT78Iik
日本語のフォーマットわ文学や芸術の用途以外に使えん

12 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)