Eng.Tibet.dic toy. ↓飛 word: , , ,page: ,from 2018/09  綴は Wylie 表記。  Link free.    (C) 2018, 鳩摩羅童子. All Rights Reserved.   
above iframe's url =  
太文字のサブタイトル単語を右クリック、リンクアドレスのコピー(E)、が単語 url の正式入手法)   ,   page_sub
mess_max init
 jump to ソース #url
2分法 memo       2019/08 page_sub hist: editable
← もっと Z 方向 (page 番号小さい化 less less)     もっと A 方向 (page 番号大きい化 bigger bigger) →  【page_sub の手動 tuning 要 ?】
↓ この tbl の尻 (#exact_tbl_end) へ飛ぶ
mess init
↑ 本Table の頭 (#exact_tbl_strt) へ戻る

〒 Reg_exp : 上記 iframe 表示結果を更に 正規表現で検索 して、抽出し直す。   (この javascript 正規化検索機能は 2019/06/15 に追加。)

 --- 上記標準検索には、 exact option 等が無い。イイ迷惑。 ex. flow と指定すると flower も拾ってくる。疲れる。  (flow は、Ctrl+V で paste 可能。)
  ex. \bflow\b ← (\b は、語境界 word boundary)  flower 等混在の 1116 枠アホ結果から flow 完全一致 177 枠のみ抽出。 

About this】 This is enhanced tool of "English Tibetan Dictionary Online" in tumblr.com.

jump to dic_list.   〜この toy は、チベット人にも便利だと思うが、日本語部分は想像力で補って下さい。〜

New version (now in test phase ,, as of 2019/11/09).

上の i-frame の HTML オモチャは、下記チベット online 辞書の操作性を求めたエッセンス版である。
使い方は、操作すれば、分かる。 --- So, please try.
---- (本オモチャは、きっと、「チベット語学習者の支援になる」と、勝手に確信している。ワン。)

【2019/10/31 以後】
@ word の枠に「スペル」を入れて、リターンキー or 「#tagged」ボタンを押す。 もし、tag 付き単語だったら、コレで終わり。
もし、Not Found だったら、一般検索機能で調べる。結果が複数ページの時は、チェックするのが大変。しかし、操作を java script プログラムで自動化した。Aは、その操作法。
A word の枠に「スペル」を入れて、「自動」ボタンを押す。ページ番号の切り替え判定の度に、応答 msgbox が出るので、OK ボタンを押して下さい。コレで終わり。
応答 msgbox が邪魔な人は、右の checkbox を click し、ペケ印を付けて下さい。   中間応答 msgbox を出さない (click で on/ off)
(ペケ印 on ☑ が default でも良かったが、応答が遅く、止まっていると勘違いするので default 化は止めた。しかし、page: の右横の枠内の page 番号が変化するので、そちらを見ていれば、処理中 (= busy) なことは分かる。また、最終 mess 応答は出る。なので、☑ もなかなか良い。OK に応答の操作は、時間の無駄なので、慣れたら☑にスべきである。

Logic: 各結果ページは、見出しの単語がアルファベット順に並んでいるので、最初は、p1 を開く。p1のソースに全体で何ページものかの情報が入っている。p1 と最終 p の1/2 の真ん中の page を開く。その中に無いなら、右側にあるか、左側にあるかの大小判断をする。ある方の真ん中のページを開き、再度、大小判断する。この2分検索の方式を反復する。選択範囲は、1/2,1/4,1/8,.. と狭くなっていくので、1ページより小さくなれば、収束する。運が良ければ、早めに到達する。
p.s. online のとき inframe 内の上 10cm に空白行がある。why?。tool を local file で使用するときには、空白行は無いのに。 --- 原因不明。scroll すれば、空白は隠れるので実害は無いが、イラつく。

その他: 複合語(= compound) 表記の white lotus は、#tagged でも表示される。自動の場合は、white-lotus も試して。zombie/ zombies の vetala, vetāla は、#tagged では動く、自動では、 vetāla は「特殊文字未対処」で拒絶される。

【2019/10/30 以前】
(word の枠に「スペル」を入れて、リターンキー or tagged ボタン、は、〜/tagged/スペル の url を call。srch 1, srch のボタンは、〜/search/スペル/page/n の url を call。srch 1 は、page 番号のリセット兼務。 page: の枠は、数字を修正しリターンキー(or srch ボタン) の形。
 尚、各ボタンを押すとクリップボードに word のスペルの文字を自動格納しているので、直後に ctrl+F, ctrl+V すると、検索文字が黄色にハイライト されるので page が見やすくなります。)

※ ex. 「snow」をやってみる。word の枠に snow と入れて、tagged ボタン、→ Not Found
しょうがないので、search 機能に変更。 srch 1 ボタンを押す。 検索結果が全体で何ページなのかを知るために、(i-frame の中を一回クリックして(i-frame 内容部の選択) → 自動化した) キーボードの「end」ボタンを押す。すると、i-frame 内のページは最下行に飛ぶので「PAGE 1 / 23」の行内容から、全体で 23 ページ物だと分かる。
snow は、後ろから見て、5 page 位かと当ズッポウする、page: の枠を 「5」に変更し、リターンキー。
5 page に飛んだら、先頭が sogdian で、snow より後ろ。 CTRL+F,CTRL+V 実施「snow ページ内検索」。 i-frame のスクロールバーに黄色の長い帯があったら、アタリ。 page: 「5」は、アタリ、です。
or
search 機能は、1 ページ 10 単語単位で小出しに表示してくるらしい。search 結果のソース(右クリック、「フレームのソース表示(V)」。別 tab に表示される) を見ると、<body>の(「<b」で検索。1つしか無い。)、2つ前の行に @type 〜 と言う 10 単語の索引 (の url) が付けてある。なので、ここだけ見れば、表示単語が分かる。max page 番号は「"count」で検索すれば見れる。ソースコードの自動検索は禁止されているので programming 不可能だった。不便ですがご了承の程。

チベット語辞書は、馬鹿である。アルファベット順に結果を出していないので、結局最後まで見る必要がある。
--- Sort し直すのは、易しい。<p> の中の <strong> の文字順に、<p> の位置を再配置するだけ。配列を作り、配列番号を並び替えるだけ。 ---- 暇が出来たら、やる予定。

また、チベット語のスペルはほぼ滅茶苦茶であり、実発音を知るには、かなり調べる必要がある。
チベット語の辞書は使い勝手が悪い。例えば、この辞書だと、 snow を調べるのに、not found なので、検索操作に最低でも1分位掛かる。次回 またsnow を引くときも、前回の url を保存してないと、また、1分かかる。チベット人にこの辞書しかないのは、酷である。チベット人はきっとバカなんだ (?)。
--- 当てずっぽう操作も、二分法で番号を攻めていけば自動化できる。  暇になったら、やる予定。

Not Found 後の操作改善(半自動):
srch 1 対応の max page 番号入手は、iframe 下の 「p1 get」を押し(ソースの読み込みを指示) すごく遅い、完了 message が出たら ok を入れる。で、一発。
当てずーぽう操作は「page_sub」枠に page 番号セット、次に、リターンキーを押す、あるいは、「pN get」を押し すごく遅い、完了 message が出たら ok を入れる。 from 2019/06,, last 2019/07/28
ex.
snow; snow キーインし、 「tagged」ボタン。 Not Found の結果。しょうがないので、Search 検索でやる。↓操 ボタンを押して、iframe 直下へ jump。「p1 get」を押す。 茶色枠に結果表示。
Count = 1 Page# =1 word: = snow  >Page 1 / 23<
zulema"}yarmo"}yarlha"}worlds"}whirling"}weller"}wallow"}vayudevi"}vasuraksa"}varunadevi"}

の結果だって。つまり、全体で 23 ページもの。最後の頁は zulema 〜 varunadevi の 10 見出し、だって。
当てずっぽう操作、試しに「page_sub」に 6 と入れて、「pN get」 ボタンを押すと。アクア色枠に結果表示。
Count = 10 Page# =6 word: = snow
sleet"}ski"}sixth"}shukseb"}shubs"}shampo"}season"}sclerotic"}santi"}sangkar"}

6 頁の一番上(一番左)は、sleet だって。 snow は、もう少し左(後ろ)なので、頁番号を小さくし、 5 としてみる。
Count = 10 Page# =5 word: = snow
sogdian"}snowstorm"}snow"}snot"}snabs"}slopes"}slope"}slop"}sliding"}slid"}

だって。 欲しい snow が含まれている。つまり、p5 がアタリ。iframe の上に戻って(↑Topへ戻る)、「srch」ボタンを押して、iframe に p5 を読み込む (尚、page_sub と page: の枠は常に同期されている。)。

【2109/10/30】new 「自動」 ボタンを押すと、最終ページ番号画面入手までを、全自動操作。をサポートした。応答 msgbox の OK 応答のみすれば良い(キーボードのリターンキーを10 回位押す?)。少し、遅いので、時間が掛かるが、手操作よりはマシ。2分法検索の自動サーチ。です。
ex. 「snow」をやったら、5 に収束した。 しかし、フラフラし過ぎ。難しいケース、カモ。→ No, 極、普通のケース。蛇行して収束、の典型。
page_sub hist: , 11 , 6 , 3 , 5 (page # 収束履歴) >Page 1 / 23< 23 p 物。

【能書き】
online チベット語辞書 は、さんざん探したが、とりあえず下記がイイ (?)。  tumblr.com
http://english-tibetan-dictionary.tumblr.com/tagged/frog © 2013-2018 ENGLISH TIBETAN DICTIONARY ONLINE

(検索英単語を url 部 の 〜/tagged/ 配下に input して、直接url call する形。先頭文字指定検索等は無理。page 内の search 機能を使うと、 url が 〜/search/ に変わる。〜/page/数字 でpage 番号指定可。全部で 4444 ページ現在有る模様。〜/search/単語/page/数字 も有効。tagged には bug がある。このときは、 search で代替。 直接単語登録ページへ行く方法は不明。誰か、教えて!
 |⇒ この辞書、他のチベット辞書より語彙数が多く、かなり優秀。 インド弁検索失敗時、チェックすると、残存があるかも。

 → このすごい辞書は、散々調べたが正体不明。blog でボランティアの個人の人がどこかの辞書を英語化して投稿しているのかもしれない。 メーカの辞書ではない。量が 4444 pages あるので、元辞書はかなりしっかりしたものだと思う。feeling としては、蔵漢大辞典の英語版だと思う (??)。 cf. チベット語辞書の世界[LHASA・TIBET]  5万数千単語/4444≒ 13 単語/ page で、 feeling 的には合っているネ (??)。
--- この辞書の結果の発音記号は、Wylie transliteration ワイリ方式、の様である。IPA では無い。また、この辞書の英文は、

http://rywiki.tsadra.org/index.php/Main_Page [= Tibetan-English Dictionary, Dharma Glossaries, and Resources]

(Currently Dharma Dictionary has 195,829 entries --- な、なんと、20 万エントリ)
 の左列内の Wylie 入力の検索結果と同じだった。つまり、DharmaDictionary.net の辞書である。この元辞書は、英語入力が無い。 GoldenDict と関連している。


cf. Tumblrとは?登録方法からブログ作成までの手順を解説!
★ Tunblr.com のサイトを調べていくと、「English Tibetan Dictionary Online」 という名前の人が、定期的に、tag 付きの message を投稿している。この辞書は、その結果の集合体。 この人は、 の画像の avatar を使用している、個人。

https://english-tibetan-dictionary.tumblr.com/tagged/white-lotus
https://english-tibetan-dictionary.tumblr.com/post/76395519135/white-lotus
の 2 種類の data が有る。どうも、この db は、この人が tumblr の自ブログとして 単語をタイトル名として dashboard に 1 件単位で post したものに過ぎない感触。頭イイ。
https://english-tibetan-dictionary.tumblr.com/
てのが、この人の blog address.
この人は、 dashboard 投稿内容を多分切り分けている。画面デサインは自分で作成したかも知れないが、検索機能は、 tumblr の標準機能だろう。Blog の中に Ask me anything というボタンが有るので、作者に original 辞書等を聞いてみる。--- 質問したが、送れたのか否か不明。rywiki.tsadra.org にも contact しようとしたが、E-mail add. で拒否される。疲れる。

〜/*/英単語の file 検索か、 4444 × 10 件の file 名一覧があれば、1回の scan で url が分かる。20文字×4444 =90K 文字-- 90KB --- 大き過ぎて駄目か ?。
Tumblr の Help の「ブログ内の投稿検索」を見ると、意味不明なことが書いてあって、理解できなかった。そろばん形のアイコン、って何だ。「Blog 内タイトル検索」の basic 機能が、そもそも無いのが、Tumblr はアホだと思う。
tag 付きか否かなんて、maker の理屈であり、 user から見れば、全て tagged にスべきである。
----

〒 dic_list
上記辞書は詳し過ぎて逆に基本単語が見えない事がある。
例えば、水 water の普通単語は、chhu らしいのだが、沢山有り過ぎて結局わからない。simple な辞書も必要。下記がイイ。
freelang.net の辞書。 --- 但し、基本単語でも未搭載のものが多い。チベット語の辞書は、どれもおそ松君過ぎて困る。 チベット人は、可哀そう。
https://www.freelang.net/online/tibetan.php?lg=gb © Beaumont 1997-2018 - Freelang is a registered trademark

■その他 関連辞書
@ チャン語(羌族:きょうぞく) by Glosbe  この辞書、カラフルな写真付きで視覚的、 very goo.
English-Northern Qiang Dictionary (search 枠右横▼ボタンを押すと、-Southern, -Tibetan, Mongol, Kazakh カザフ .. 切り替え可能)。
English-Southern Qiang Dictionary
phoneme synthesis (IPA word reading tool) (イヤホーンで IPA 表記の語をコピペして、その合成音を聞く tool。)
  -- しかし、バカ soft で話にならん。/pu/ が /tu/ と同じ、ʨ 「ちゃ」が無音になる(つまり、無配慮)、tʃ は聞こえる。等。
     χ も無視される。
     かなりバカであることを認識して使えば、使える。無いよりズートまし。
→ これら Qiang 辞書は IPA 発音記号表記なので、記号の音確認要。Interactive IPA Chart (audio 付き)
[尚、Glosbe の -Tibetan 辞書は、出力文字が 原語なので良くない、freelang.net の方が良いカモ。
しかし、freelang より Glosbe の方が語彙が多い、なので、チベット文字 to ローマ字 converter を使え。]


A ギャロン語 audio database by 国立民族学博物館 長野泰彦  「空耳アワー」捜し 出来ます。
http://htq.minpaku.ac.jp/databases/rGyalrong/lang/area/index.php?langindex=eng

B チベット牧畜文化辞典(パイロット版) (audio 付き)  by 東京外国語大学アジア・アフリカ言語文化研究所 チベット牧畜語彙収集プロジェクト
http://nomadic.aa-ken.jp/  --- イヤホーンの音が大き過ぎる。調節の仕方、ナシ?。頭が痛くなる。--- 直して。

c. チベット文字とワイリー表記は1対1対応するとすると、チベット語のチベット文字で書かれた単語は、大昔は表音文字だったかもしれないが、今は、全く当てにならない。スペルと発音が乖離(かいり)している。そのギャプが、ひど過ぎる。英語のスペルはまだマシ。--- との印象。
文字としては、失敗作との感。国がしっかりしていなかった証拠だと思う。何の為の文字なのかの認識が国や国民に無い(?)。日本人で良かった、と思ってしまう。

/khra/ の発音。/cʰa/ に化けている。ギャロン語地区の人の (k-d) 音通に似ている。もう、メチャクチャ。
c. IPA の使い方がオカシイ。語頭の「が」の表記が /k/ なのはイイのか?。/g/ にすべき。policy がオカシイ。IPA は発音記号である。表意文字では無い。IPA の /k/ は /g/ を兼務しない。
もし生徒が、糖 ka ra /kara/ を、素直に IPA 表記から「カラ」と発音したら、先生は生徒を叱るのか。酷だろう。生徒は悪くない。/gara/ と表記してあれば、「ガラ」と発音する。当たり前の話だ。


C チベット語電子辞典 Copyright (C) 星実千代・星 泉  ,, センス・質 ともに最低。の全く使い物にならない辞書。英語検索ナシ。但し、Wylie 入力(の部分検索)、は、良いかも。
ex. 【チベ】sgrig med byed (= cause disorder/ confusion/ turmoil [IW]) しどろもどろだ (g-d, y-r)
を「sgrig」の部分検索で確認したら、下記が引っかかった。 freelang.net では無理。
[4trii 3nga:npo ]「修」行儀の悪い
しかし、 sgrig はどこにあるの? と、言いたい。日本語検索「くも」は [1trinpa] 「名」雲、で、アリ。しかし「雲」は「該当ナシ」「くもり」のつもり、みたい。--- オソマツ !。

■ その他のサイト。
チベット語・チャン語・ギャロン語 の古代インド語検証 & 他検証
私のサイト。この辞書の必要性の母体となったサイト。

小学校の教育漢字 検証
私のサイト。約 1000 単語の日本語・インド弁・チベット語 間のソックリさん捜し。


■ freelang.net の表記スペルはワイリーとは違うみたい。どこにも書いてない。イイ迷惑。
Tibetan language for beginners (size = 72 pages)
freelang.net で friend 友を引くと、 dhrog-mo の dhrog が「とも」に近い feeling, しかし、tumblr.com の friend の結果には、含まれない。疲れる。
Google 「dhrog-mo」を検索したら、上記 Tibetan language for beginners の教科書発見。
p12 に my friend = nge dhrog-po のサンプルあり。
---- この本、非常に面白い。 チラッと見たが、日本語似と感ずるところは、I の nga 吾/我と he の kho-rang 彼、ね, he/ she の khong 彼の、かの (honorific 敬称)、 以外、全く無かったワ。

Regular Expression Tester 正規化表現コンバータ    @
Regular expression : <p>(.(?!<p>))*?\b検索文字列\b.*?</p>

cf. perlreref - Perl の正規表現のリファレンス

html 言語を知らない人は、今や時代遅れである。
javascript や perl を知っている人は、人並みより上。
正規化表現を使いこなせる人は、すごく時間の節約ができる。半日掛かる作業を 10 秒でやってのける。
@ の tool で確認していると、思った様に動作しない。奥が深い。 疲れる。時間つぶし、には良い。

from http://www.ryokurian.jp/atelier/geso/ を copy

htmlソースをJavaScriptで取得

サイトのhtmlソースをJavaScriptで取得する方法。まずソースを取得するcgiを用意して、取得したソースをJavaScriptでクロスドメインで受け取れるようにする。 具体的には次の通り。

なんか言葉で説明するよりこのページのソース見た方がわかりやすいかも。(苦笑)


Here's 〒 url : 例)アドレスを入力して取得ボタンを押して下さい。  ↑ i-frame の下に戻る。
  ↓<input type="text" id="url"

  ↓<textarea id="source" style="width: 100%;height: 300px;"></textarea>


txt_b AREA
  
exp_l   RegExpress(re_0,in0v,pick)サブルーチンの最後で exp[0] が save される。 left

exp_r   RegExpress(re_0,in0v,pick)サブルーチンの最後で exp[cnt] が save される。right


^^^^ new method 2019/11/07
Blog page all url list, direct retrieve. Get last url by one search.
くまらマクロ00
=url_="view-source:https://english-tibetan-dictionary.tumblr.com/page/",=upos_="url:https:\/\/english-tibetan-dictionary.tumblr.com\/post\",=st_="{@type:ListItem{}position:"
くまらマクロ01
=pg_="{@type:ItemList{}url:https:\/\/english-tibetan-dictionary.tumblr.com\/",=it_="itemListElement:"
マクロ
@x1-701,wk-,x1+,^l,{del},c+(url_&x1&"",~,sl3000,^^f,+{d 12},sl500,^c1,sl300,exe(sv1=replace(sv1{}""""{}""):sv1=replace(sv1{}upos_{}""):sv1=replace(sv1{}st_{}""): sv1=replace(sv1{}pg_{}""):sv1=replace(sv1{}it_{}""),sl300,wk+,if(x1>800)-14
コレで4444 page 分を一括 get。^^f の事前キーは、「{"」である。

^l は、url 枠。
----
やり方変更。やるべきことは、url list の一覧の pick up に尽きる。その中の冗長文字削除は、後でゆっくりやれば良い。 URL source の html の「{"」と「}]」で挟まれた文字列を pick up すれば良い。
{"」指定で
^^f,+{d 12}, ^c1,exe(pos_=InStr(sv1,"}]"):sv1=Left(sv1,pos_),wk+
zoom すると、「,」の不正用法が分かる。
マクロ
+3,al(wk,@,wk-,x1-401,x1+,^l,{del},c+(url_&x1&"",~,sl4000,^^f,+{d 12},^c1,sl300,exe(sv1=replace(sv1{}""""{}""):sv1=replace(sv1{}upos_{}""):pos_=InStr(sv1{}"}]"):sv1=Left(sv1{}pos_),wk+,if(x1>500)-12
--- p6 がスキップされたが、,sl3000,を,4000 にしたら、直った。なので、 4000 にした。
1001 から 1500 へ 500 p 指定したら、wk が al(, j0( できなかった。大きすぎてパンクした模様。 al(len(wk) は、下記だった。30万 バイトが限界なのかも。なので、100コずつやはりやる。
---------------------------
Kumara al(文字式
---------------------------
303184
---------------------------
OK キャンセル
---------------------------
100 回の時 6万
---------------------------
Kumara al(文字式
---------------------------
62656
---------------------------
OK キャンセル
---------------------------