http://q.hatena.ne.jp/1347953551
フランス語は、代名詞+動詞、冠詞+名詞、前置詞+名詞などが結合するので、文法+概念という組合せが日本語の文節と近い(順番は逆ですが)気がします。
英語ではフランス語みたいにならないのでしょうか。
http://en.wikipedia.org/wiki/Phrase
フレーズでしょうか。
日本語では文の単位として文節が用いられるが、文節と句との区切りは必ずしも一致しない。たとえば「私の手紙を読みました」は、文節としては「私の-手紙を-読みました」と区切られるが、句としては名詞句「私の手紙」という区切り方が必要である。
1)Text segmentation になるのかな
http://en.wikipedia.org/wiki/Text_segmentation
日本語だと「形態素解析」です。
http://ja.wikipedia.org/wiki/形態素解析
そのあと「The First」のように
文法的なつながりを関連付けて行くのは「構文解析」です。
http://ja.wikipedia.org/wiki/構文解析
http://en.wikipedia.org/wiki/Parsing
2)に付いては、品詞のくくりだし順序が場所によって異なっているように見えます。
が、これが正解と言うのはありません。
1)に色々なフリーソフトがありますので試してみられるのが良いかと。
1)形態素解析でいいと思います。
http://e-words.jp/w/E5BDA2E6858BE7B4A0E8A7A3E69E90.html
2)このツールで調べることをおすすめします。
http://nlp.iit.tsukuba.ac.jp/intro/tools.html