訪問者:氏名不詳
✔ REC ON
✅ 接続チェック
問題 8-20
✔ 接続状態をおしえてください。
✔ 前回学生証番号を登録した人で、今回、「氏名不詳」になっていた人は「再登録」と書いてください。
8-20 の回答を +
0/31 ...1点以上 0%
文字情報の処理
今回の課題 †
- 文字データの処理がコンピュータの役割を決定的に変えた。
- 計算機から社会情報の処理機への飛躍。
- どうやって文字が「わかる」のか、わかろう。
- それが、いま、労働のすがたをどう変えているか、考えよう。
根本から考えよう †
- コンピュータの普及は、繰り返し労働のすがたを変えてきた。もちろん、労働だけではなく、もっと広い社会的な影響のなかで考える必要があるが。
- ただ、注意しよう。この影響は、超長期の歴史的な視点で考える必要がある。
- 講師がコンピュータ(らきしもの)を使いはじめて40年以上になる。
- この間、何度も何度も、技術的な転換点があった。たとえば、OSの発達、インターネットの普及、センサの発達によるデータ量の急増、などなど。
- 変化の激しい世界であるため、外からながめているだけの人々(社会科学者の多くも)には、なにかしら画期的な出来事が起きているようにみえるようで、繰り返し、内容がハッキリしない流行語(バズワードというそうですが)で、いままでと決定的に違うことができるようになった、と告げてきた。
- しかし、流行は2、3年で終わる。今度こそ決定的、今度こそ、と繰り返しながら...新しいニュースを報道することを生業にしている人々(学者と称する人もふくめて)には、いちおう食うに困らない、ありがたい世界かもしれないが「浅薄」。ワケもわからず、鵜呑みにして、次から次に新しいものに飛びつくのは「愚か」。
- 長期の流れでみると、基礎の基礎は変わっていない。しかし、短期でみると決定的な変化が繰り返されてきた。この講義では、この多層的な発展を遂げる全体を「コンピュータ」とよぶ。表層のAIだとか、ビッグデータだとか、エキスパートシステムだとか、クラウドコンピューティング、だとか.... はすぐに終わってしまう虚しい流行語。
2 mini
問題 8-1
「コンピュータ」の本質をなす、変わらない「基礎の基礎」とはなんでしょうか?前回、電卓と比べながら話した中心ポイントです。
解答と解説 8-1解答
解説
- 繰り返しは簡単だが、ある条件で「やめる」のを自動化するのはむずかしい。
- 1,2,3,4,.. といつまでも足すことはできるが、10で終わりにするとう判断の自動化ができるようになったのが、コンピュータが「知的」になったターニングポイント。
- これは計算というアタマでやってきた作業のストップ=判断だが、自動化の先輩である「機械」でも基本は同じ。
- 自動化といっても、同じ作業を連続して続けること、たとえば紡績機で紡錘を回して綿糸を紡ぐという連続作業はできるが、巻き上がったとろこでストップするのは人間がやってきた。機械が導入されても、エンドレスの自動装置を「コントロール」する操縦型の労働がずっと人間の労働のだいじな部分だった。
- 自動車も連続な車輪の回転は「自動的」でも、ストップさせるのは人間。このコントロールする労働が不用になりはじめているが、これは、コンピュータの大元のところに、この「やめる・はじめる」型の切替、コントロールの原理をもつから。
- しかし、この原始的な「分岐」と「自動運転」との間には、大きな距離があることはモチロン。この距離がどのように埋められるのかは、この後で... ただ、AIが埋めた、というようなお馬鹿なことはいわないようにしよう。そんなもの一つで埋まるような単純なシロモノではありません。
8-1 の回答を +
41/45 ...1点以上 91%
文字をどう記録するか †
3 mini
問題 8-2
文字データはメモリ上にそれぞれの文字の形をしたデータとして保存される。
たとえば「こまざわだいがく」という文字列であれば、[こ][ま][ざ][わ]...という字体(font)をメモリ上に順番にコピー・ペーストして並べられる。
この説明は適切か。誤りがあれば正せ。
解答と解説 8-2解答:誤り
- 文字データはメモリ上に
それぞれの文字の形をしたデータ一定のルールできまる数値として保存される。
解説
- いま、このホームページを見ている人は utf-8 という unicode の文字コード表を使っているはず。
- たとえば「こ」は十進数で12371として保存される。
- ブラウザがChromeだったら、「表示→開発/管理→JavaScript コンソール」を選んで
- 'こ'.charCodeAt(0) と入力してリターンキーで確かめられる。
- String.fromCharCode(12371) と入力してリターンキーをおせば、"こ"とでてくるはず。
- 日本語のような2バイト文字には、文字コード表が数種類あり、以前はjisコード、shift-jis, eucとか、複数あって厄介だったが、最近は unicode に統一される傾向。
- この12371を「こ」のかたちで画面にだすときに、フォントというデータが追加的に利用される。「こ」といっても、太いのや細いの、丸っこいのやスラッとしたの、いろいろなかたちがある。これは、「こ」=12371とは独立。12371 with フォントX でいろいろなかたちで現れるだけ。実体 12371 は変わらないが、形態 X はいろいろに変わる。
- 12371 は十進数で5桁になるが、16進数だと4桁に収まる。日本語を含む文字コード表は、この範囲。
- さっきのjavascriptのコンソールで、dec=12371 でリターンキー。そおあとで、dec.toString(16) とやれば、"3053"と16進数で表示される。これを|30|53|に分け、2バイトになる。1バイトは16*16で256。いまのコンピュータは、だいたい2バイトを一度に加算減算できる。
- dec.toString(2) とやれば、二進数の"11000001010011"が表示されるはず。電荷の差で 0:off,1:on の半導体スイッチ(のようなもの)で最終的にメモリに保存されている。
8-2 の回答を +
22/40 ...1点以上 55%
▶試してみよう
▼試してみよう
3 mini
問題 8-3
キーボードからと入力するとき、「こ」「ま」「ざ」「わ」「だ」「い」「が」「く」という8文字に分解される。それが、こまぎれの「こまざわだいがく」ではなく、まとまった「この駒澤大学だ」という意味はどこに記録されるのか。
解答と解説 8-3解答
入力した人のアタマのなかに「記憶」されるだけ。コンピュータのなかには、どんな意味も記録されていない。駒澤大学という意味で、「こまざわだいがく」と入力したことを覚えておかないと、このデータを後で使うことはできない。
講義では、「情報=メッセージ+データ」と定義した。コンピュータに記録されるのは、データであってメッセージではないことを思いだそう。
したがって、コンピュータは、メッセージをともなう文を生成できる(書ける)わけではない。
メッセージをともなう文を書けるのは、人間。人間は、いろいろなことを見聞きし、感じ、考えることで、メッセージをともなう文を、文字でかく。書かれた文(情報)から、メッセージを取りさった文字列(データ)がコンピュータに記録されることをしっかり押さえよう。
8-3 の回答を +
32/48 ...1点以上 67%
文字列をどう利用するか †
3 mini
問題 8-4
紙に書かれた文字や印刷された文字も、データとメッセージの分離は生じる。コンピュータと紙の書類では、使い勝手が違うが、やりたいこといは共通性、連続性がある。
たとえば、図書目録のようなもの、紙のカードでも、コンピュータでもやりたいことは同じ。
...ということで、
いま、ここに「こ」「ま」「ざ」「わ」「だ」「い」「が」「く」とかいた8枚のカードがある。
このカードを、アイウエオ順に並べよ。
リアルにいま目の前に、カードがあるとして、どうやって並べたか、説明せよ。
解答と解説 8-4「い」「が」「く」「こ」「ざ」「だ」「ま」「わ」
8枚のカードをテーブルの上におき、まずいちばん若い「い」を、次に「が」を... と順にとって並べた、というのがふつう。
After:
この問題は採点対象からはずします
8-4 の回答を +
0/45 ...1点以上 0%
3 mini
問題 8-5
コンピュータで並べ化の作業をしようと思う。
人間がやるときの、”8枚のカードをぜんぶテーブルの上にひろげ、まずいちばん若い「い」を、次に「が」を... と順にとって並べた”という操作のうちに、コンピュータでやれないことはなにか。
コンピュータでは、どういうやり方でやったらよいか。コンピュータのメモリのある場所に、「こ」「ま」「ざ」「わ」「だ」「い」「が」「く」に相当する文字データ(12371:11000001010011のような数値)が順番にならんでいる状態をイメージして考えてみよう。
解答と解説 8-5解答:
- コンピュータにできないのは、8枚のカードをぜんぶテーブルの上にひろげて一度に見渡して「い」を取りだすこと。
- できるのは、二つの数値の計算(引き算して正か負かで大小を判別すること)だから、「こ」と「ま」、「ま」と「ざ」のように、二つをとりだして比較すること。
8-5 の回答を +
28/41 ...1点以上 68%
▶実際にどうやって
▼実際にどうやって
1 mini
問題 8-6
解答と解説 8-6解答:早く探すため。
解説:
- 図書館の目録カードを考えてみよう。バラバラの10000万枚の蔵書カードから、目当ての一枚を探すのはたいへんだが、アイウエオ順にならんでいれば、すぐに見つかる。
- 住所録でも、オフィスで使うたとえば取引契約などの書類でも、病院のカルテでも、一定のルールで整理することが大事。整理されていないデータは使いものにならない。
- 20世紀のオフィスワークでは、このようなデータ処理を紙ベース(といってもバラバラに切り離せる書類やカードなど、いろいろな工夫はなされたきたが)で、人の「目」と「手」によっておこなってきた。これは、相当に労働吸収的だった。
- データを追加したり更新したりするときも、そのデータを正しい位置にしまうことが重要。
8-6 の回答を +
31/47 ...1点以上 66%
データのデータ †
▶データ構造
▼データ構造
- たとえば紙製の書誌カードには、書名、著者名、刊行年など、文字や数字(広い意味での文字です。数値は文字ではありませんが...)が、一定のルールで書かれている。たいてい場所的な順番で、書名か、著者名か、などがわかる仕組み。
- 目録カードの文字は、ただならんでいるのではなく、位置によって一定の意味をもつ。つまり、書名、著者名などの。
- この意味はどこから生じてくるかというのと、きまった書式、ルールによる。
- コンピュータも、文字データを並列に並べるのではなく、図書目録のように一定の書式にまとめることで、メッセージとは違う「意味」を扱うことができる。一番目なら「書名」という「意味」。
2番目は著者名だが、(ふりがなと((姓)(名)))の順で、というように。こういう関係の束を「構造」という。
- いろいろなデータは、そのデータに関するデータをもつことで、メッセージとは異なる「意味」(らしきもの)を扱うことができる。データには「著者名」という文字は書いてないが、書名でならんでいるデータを検索して、2番目のデータを著者名として引きだすことができる、など。
- 「この本の著者は?」に「小幡道昭です。」と答えると、著者の意味がわかっているような気がするが、なされているのは、検索+データ構造のあつかうプログラムが実行されているだけ。
- コンピュータで文字データを処理するときには、データに構造をもたせることが重要となる。
複雑な文字データ †
▶このページを例に...
▼このページを例に...
- このホームページを例に、文字データの構造化を説明してみます。
- みなさんがいまみているこのぺーじです。数値の計算など、ほとんどしていません。
- みえているのは、数字も含めて文字ばかりです。
- ソースをみてみましょう。さっき、javascriptコンソールをひらいたときと同じようにして、「ソースを表示」を選べばOKです。
- パーツ(divとspan とか p とか.. で区切られた)が配置されています。図書目録ほど定型的ではありませんが、いろんなパーツに、きまった書式が与えられているのがわかります。
- こうした文字データの複雑な構造は、コンピュータのサイドで自動化できるかというと、現在のところ、無理です。
- これはホームページをつくる人がやらなくてはダメ。
- ブラウザーは、指示されたとおりに、正確に早く表示はするのですが....
- ここが、コンピュータと労働の基本的な関わり方を知るポイントです。モタモタした人間が指示すると、テキパキしたコンピュータが一瞬にかたづけてしまう。
- ただし、人間とコンピュータの間にあるギャップは、絶対的なものではない。
- 構造化するための入力を補助するプログラム(エディターなど)が発達すると、それナシにやってきたのに比べると、人間サイドの仕事は絞り込まれます。しかし、絞り込まれた内容は人間が(つまり私が)やらなくてはなりません。
- 目の前にはあるのは、少しずつ変わってきた、そして変わってゆく世界です。
まとめ †
▶まとめ
▼まとめ
- 人間が日常あつかう情報の多くは、基本的に「ことば」になっており、文字で書かれた文書にされている。
- 文字は、一定のルールで、数値に対応させることができる。
- コンピュータは、文字データを数値計算の方法で処理することができる。
コンピュータは計算機とは根本的に異なる性質をもつ情報処理装置となった。
- コンピュータは、従来の紙を手段としたデータと処理を、量と速さ、柔軟性の面で圧倒。
- 紙に比べて「保存」の面で不安視されてきたが、技術的には解決できるもの。
- 人間の労働において、データ処理を通じて、対象を管理することは重要な要素。
- コンピュータは、物理的な機械ではこれまで処理のむずかしかったデータ処理、人間がアタマと、それにカードのような道具をつかってこなしてきた領域を分解し、その一部を取りこむ可能性をもちはじめ、労働のすがたを変えつつある。