ФОРУМЫ НА "ЭХЕ МОСКВЫ"

Говорим по-русски

Архив форума (#15)
11.11.1999 06:34 - 12.11.1999 13:37
Предыдущий | На главную страницу | Вниз | Следующий

Дмитрий Островский  Франклин не был президентом!
Арнольд  Модифицированный индекс Самойлова
Саша  
Дмитрий Самойлов  
Арнольд  Усы гусара украшают
Дмитрий Самойлов  
Арнольд  Людмиле
Людмила  a pro po
Арнольд  Три бочки сметаны
кстати  Всем обо всем
 
Дмитрий Островский
Пятница, 12 ноября 1999 года, 13:37
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Франклин не был президентом!

1) Я слышал (и изредка использовал) fractal dimension просто как фрактальная размерность (сабституируя эту эквацию etc.)
2) А что если считать индекс Самойлова не как число меченных слов/общее число слов, а как число встречающихся меченых слов/общий словарный запас.
3) Опровергните гипотезу. В ново и ветхозаветных текстах многие понятия остались непереведенными не только по незнанию того, что жже они означают или отсутствию подходящих русских слов, но и из-за желания сделать текст загадочнее, что, как иногда думают, придает ему больше святости. Отсюда и прохладное отношение современных иерархов к переводу на современный русский язык.
4) Как обстоят дела с формализацией (на уровне, пригодном для разумения компьютера) правил переноса? Известно ли это многоуважжаемому собранию?


 
Арнольд
Пятница, 12 ноября 1999 года, 11:21
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Модифицированный индекс Самойлова
E-mail: arno@kaluga.net

Дмитрию
С трепетом прочитал про э-заикания. Я всегда воспринимал Word как живое существо, а теперь еще более укрепился в своем мнении.
Загадки хороши. Как я понял, и хирург, и профессор - представительницы прекрасного пола, и судьба послала им ужасные испытания...

Благодарности за поиск алгоритма несколько преждевременны. У меня все больше зреет уверенность, что он неприменим в данной ситуации, и вот почему. Поисковый робот (с некоторыми допущениями) рассматривает все тексты на равных условиях. В данном случае (quod licet Jovi, non licet bovi) это не пройдет. Слово (заимствование или архаизм), вполне допустимое в одном тексте (например, богословской статье), совершенно недопустимо в другом (например, научном реферате). И наоборот.
Так что для определения "веса" архаизма или заимствования (далее S-терминов :) необходимо:
1) Выполнить рубрикацию текстов (10-20 разделов) (рефераты, художественные, публицистика, научные статьи etc.)
2) По каждому из разделов экспертным путем определить генеральную выборку "эталонных" текстов. Выборка должна быть репрезентативна, чтобы в нее попало как можно больше разных S-терминов.
3) По совокупности текстов каждого раздела составить перечень S-терминов с определением частоты вхождения каждого в выборку.
4) Для каждого раздела определить эталонные веса S-терминов методом обратной пропорции (наиболее часто встречающимся терминам присваивается вес, близкий к нулю, самым редким - близкий к единице).

Расчет модифицированного индекса Самойлова
------------------------
Пусть в данном тексте присутствуют различные S-термины {s1, s2, ... sN}
Каждый термин встречается с частотой {n1, n2, ... nN} (n-число вхождений)
Эталонный вес каждого S-термина для раздела, к которому относится текст: {w1, w2, ... wN}
Примечание - если термин не встречается в эталонном перечне, его вес устанавливается равным 1.
Взвешенное число S-терминов Ns = СУММА(n1*w1 + n2*w2 + ... nN*wN)
В вырожденном случае (если ни одно слово не входит в эталонный перечень) Ns будет равняться общему числу S-терминов в тексте (как в случае немодифицированного индекса).
Индекс Самойлова (IS) определяется как отношение Ns/Na * 100% (Na - общее число слов в тексте). Dixi.

По меткому выражению Щекна, кнопочек "Нажми меня", здесь более чем достаточно. С удовольствием приму любые критические замечания.

Трехсигмовые - это жаргонизм, означающий "попадающие в область наиболее вероятного значения". Значения откликов практически любого эксперимента на шкале относительных частот распределяются по гауссиане (такая кривая с пиком в области математического ожидания), а сигма - это характеристика этой кривой (выраженная в отклонении результата от среднего значения). Так вот, в плюс-минус три сигмы попадает 95% всех экспериментов, и остальные 5% обычно отбрасывают как негодные.
К понимающим людям - Бога ради, не критикуйте меня за неточность формулировок. Популяризаторство - вообще неблагодарная вещь :)
К слову, о популярных научных статьях - в "Комсомолке" лет шесть назад в статье о компьютерах встретил такой перл: "Лучше всего сейчас покупать компьютер на 386 процессорах"


 
Саша
Пятница, 12 ноября 1999 года, 10:37
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 

Дмитрию Самойлову
ответ на сообщение от 10.11.99: Возможно, я не совсем удачно встряла в ваш "междусобойчик". Моя реплика - это скорее не возражение, а продукт моих собственных попыток представить, каково это говорить про науку (в частности, про генетику) не в популярном изложении на языке домохозяек, как это, на мой взгляд, происходит у англоязычных народов. А также, как много информации может извлечь американская домохозяйка или любой неспециалист из узкоспециального генетического текста.

Для Кстати.
Вы пишете 11.11.99 "Пункт 5. Под "откровенно заимствованными" словами я подразумеваю те, где их "чуждое происхождение" ясно и без заглядывания в словарь (конечно, это довольно субъективно). То есть "лошадь", "собаку", "очаг" или "кирпич" мы к ним заведомо не отнесем, "линия", "корона" и "тип" находятся где-то на грани, а вот "метод", "форма", "теория", "музыка" и "принцип" -- искомые."
По-турецки, предмет кирпич называется кирпич, тоже самое - про арбуз. Так что,я думаю, это заимствование, только довольно раннее.


 
Дмитрий Самойлов
Четверг, 11 ноября 1999 года, 19:01
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 
E-mail: samoilov@practica.ru

Арнольду
1. Да-да, я на это, в общем, и намекал. Это как та загадка: отец с сыном попадают в катастрофу, отец погибает, а сына отвозят в больницу. Хирург, увидев его, восклицает: "Сынок!". Как это может быть?
А вот загадка посложнее: сын отца профессора бьет отца сына профессора. Кто кого бьет, если профессор в драке не участвует?

Кстати (это обращение), приношу глубочайшие извинения, что использовал Вас для своих упражнений в провокаторстве.

2. Э-застреванием на языке самойлистов (это ученые, рассчитывающие самойловки) называется одно из странных свойств ворда: если пустить его скакать от одного "неправильного" слова к другому, то, дойдя до какого-то слова с буквой "э", он, вместо того, чтобы идти дальше, начинает метаться на месте (страшное зрелище). Загадка этого феномена в том, что застревание происходит далеко не на каждой букве "э". Так вот, вместо того, чтобы разобраться в чем тут дело и устранить причину, я просто стираю букву, на которой он застрял и пускаю макрос по новой с этого места. Способ, как сами понимаете, не лучший -- из-за этого я не могу оставить макрос на ночь: сижу как сыч, жду, когда он запнется.

3. Большое спасибо за поиски алгоритма. Трехсигмовые -- это плохие?


 
Арнольд
Четверг, 11 ноября 1999 года, 18:23
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Усы гусара украшают
E-mail: arno@kaluga.ru

Дмитрию Самойлову
Тщательно покопавшись в себе на предмет излишней доверчивости, пришел к выводу, что все дело в моем отвратительном, пещерном мужском шовинизме. Уж и бит я был (виртуально) не раз, а все туда же...

Не понял насчет э-застреваний. Что имелось в виду?

Относительно алгоритма отсечения трехсигмовых текстов (почти как "Трехгрошовая опера" :) постараюсь вспомнить, где видел описание. Лобовой поиск ничего не дал. Поищу еще в англоязычных ньюсах, может, там видел.

Спасибо за английскую кальку русского "плуга". Мало кто знает, что PnP на самом деле означает "Plough'n'Pray" :))

Желаю удачи.


 
Дмитрий Самойлов
Четверг, 11 ноября 1999 года, 17:57
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: 
E-mail: samoilov@practica.ru

Кстати.
Большое спасибо за фрактал. Решаю задачу 2. Дело идет туго, совсем отвык напрягать мозги в этом направлении.
Правильно я понял: "fractal dimension" нужно переводить как "дробная размерность"? Затем: все три определения фрактала эквивалентны? Или только первые два? Или все три -- это разные вещи? Или как? Объясните, пожалуйста, самому мне тут не разобраться.
Про англо-башкирский -- очень забавно. Нехорошо, конечно, судить о работе по газетной заметке, но уже само название чего стоит! Да, и забыл поблагодарить Вас за рассказ о реформе немецкого -- это просто прелесть.

Арнольду.
1. Смотрите, как Вас легко сбить: достаточно совершенно непроверяемого утверждения про усы, чтобы отвергнуть все приведенные мною -- и вполне очевидные -- факты. А что ж это за аргументы: "У человека с филологическим образованием вряд ли будут такие фундаментальные знания по математике, а уж про альфа-канал ей откуда знать". Вот я например -- человек с медицинским образованием -- теперь знаю, что такое альфа-канал и могу совершенно свободно (copy--paste) блеснуть на каком-нибудь другом форуме (а также и фракталом, алгебраическими числами и много чем еще, чем я здесь обогатился). А откуда у Франклина были такие фундаментальные знания, что он и Гольфстрим открыл, и громоотвод изобрел и президентом был?
2. Макрос ни за что не опубликую: там настолько позорное решение проблемы э-застреваний (ничего термин?), что потом хоть на форуме не показывайся.
3. Про зонт -- это замечательно. Оказывается, действительно, это от голландского zon (солнце) + dek (покрышка). Зонтик -- по аналогии с мостик, листик -- показался уменьшительным от несуществующего зонта. Поучительная история.
4. Английские слова, заимствованные из французского: может и не 90%, но много. Однако обратное неверно: во французском английских слов почти нет (разве что в молодежном жаргоне). Вероятно, это результат норманнского завоевания: на долгий срок французский стал в Англии языком знати. А вот у англичан отыграться не получилось: нашлась на них Жанна д'Арк. Да и после, вплоть до Елизаветы Англия по сравнению с Францией была довольно маленьким, слабым и отсталым государством, так что понятно, откуда и куда могло идти заимствование.
5. Спасибо за внимание к моим расчетам. А то всем жареные факты подавай, а как кропотливая исследовательская работа -- так их нет.

Людмиле.
Очень рад Вас здесь видеть.
Конечно, происхождение английского от башкирского -- абсурд. Всем известно, что он произошел от русского. Вот яркий пример: как по-английски "плуг"? Plough -- исконно русское слово, переписанное английскими буквами. И это не случайно: именно русские обучили дотоле дикие племена земледелию, то есть собственно, цивилизации, -- ну и заодно говорить по-человечески.


 
Арнольд
Четверг, 11 ноября 1999 года, 15:49
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Людмиле
E-mail: arno@kaluga.net

Прежде всего спасибо Вам за посещение и комментарий.
Действительно, Марина Королева как раз по образованию "структуральнейший лингвист", так что... кхгм... kstati, что Вы там говорили про усы? ;) Я свое замечание отзываю.

Насчет интереса к русскому языку - не удержусь от цитаты:

Во дни сомнений,
во дни тягостных раздумий
о судьбах моей родины,-
ты один мне поддержка и опора,
о великий, могучий,
правдивый и свободный
Русский язык!
Не будь тебя -
как не впасть в отчаяние
при виде всего,
что совершается дома?
Но нельзя верить,
чтобы такой язык
не был дан великому народу!

Сколько лет прошло, а как будто вчера написано.
Потом, знание языка есть сильный фактор профессиональной пригодности. Кому как не Вам знать... Кстати, в Вашей фирме все еще технических писателей набирают? :)
Еще раз спасибо за комментарий.
Всем желаю удачи.


 
Людмила
Четверг, 11 ноября 1999 года, 14:59
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: a pro po
E-mail: ludfil@socap.ru

Всем здрасьте!
Хотелось бы вставить пару комментариев в ваш интересный, сугубо мужской междусобойчик. Извините, что не смогу указать, кому мои соображения предназначены в качестве ответа и на какой вопрос, слишком много было прочитано зА раз.
1. Разрешите вас всех поблагодарить за большой интерес к проблемам лингвистики и, в частности, к русскому языку. Честно говоря, даже не ожидала, что кого-то в нашей стране ЭТО еще может интересовать, кроме тех, кто занимается языком по долгу службы, а таковых с каждым годом (да что там годом, днем!) становится все меньше и меньше, поскольку на чистом энтузиазме долго не протянешь, для этого еще надо себя чем-то подпитывать (в смысле питаться пищей как таковой).
2. На самом деле, связь между языком и математикой уже давным-давно выявлена, и занимается ею, т.е. связью, такой предмет как структурная лингвистика. В МГУ даже есть такое отделение (или факультет? не знаю точно) на филфаке.
3. Анекдотическая история о «научном» труде по теме происхождения иностранных языков от башкирского просто потрясает. Неужели такие глупости еще могут восприниматься на полном серьезе? Хотя лично я уверена, что посыл-то был правильным: любому первокурснику филфака известна теория об общем происхождении ВСЕХ индоевропейских языков от одного общего праязыка (извините, не совсем уверена в правильности написания всех этих терминов, слишком давно не занималась этой тематикой), но расставлять все эти языки по рангам, какой главнЕе и какой первЕе на основании сходства каких-либо признаков – это, извините, маразм. Все равно что утверждать, де русский язык произошел от украинского на основании более ранней исторической известности Киевской Руси перед Государством Российским.
4. Именно по этой причине не считаю правильным рассматривать французские, а особенно латинские и греческие слова (последние уж и вОвсе попали туда почти все через латынь) в английском языке как заимствования – слишком тесно история всех этих народов, а стало быть, и языков, переплетена друг с другом. А то если взглянуть с исторической точки зрения, в английском языке останутся «родными» только те, что употребляли древние кельты (к примеру), а в русском – только язык древних россичей (или руссичей? Пусть меня поправит тот, кто знает точно).
5. Прошу рассматривать все мои комментарии как сугубо личное мнение дилетантки, ни в коей мере не претендующей на «истину в последней инстанции».


 
Арнольд
Четверг, 11 ноября 1999 года, 10:55
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Три бочки сметаны
E-mail: arno@kaluga.net

Дмитрию Самойлову
1) Насчет провитамина каюсь - не подумал. Впрочем, в Сеть моя супруга не ходит (и слава Богу), а за разъяснение сказала спасибо.
2) Относительно Кстати - близко не мог предположить, что это хорошо законспирированная ведущая. У человека с филологическим образованием вряд ли будут такие фундаментальные знания по математике, а уж про альфа-канал ей откуда знать...
3) А обратный адрес Марины эховский? Не было ли там подмены?
4) По самойловкам - интересные результаты! Хорошо бы макрос опубликовать (если есть). Хм... а результаты для разных версий MS Word будут сильно отличаться?
5) Интересно, почему индекс у Нового завета выше, чем у Ветхого? Может быть (если исключить имена собственные) в Новом завете больше словарный запас?

Кстати
1) Относительно заимствований в славянских языках. Где-то читал, что слово "зонт" (Зонт автоматический. ГОСТ...) голландского происхождения, и там называется именно "зонтик". А потом суффикс "-ик" был смело отброшен...
2) Про впечатляющий список заимствованных английских слов. Мне кажется, что 90% из них- галлицизмы. Стоит прочесть "Белый отряд" Конан-Дойля, там процесс проникновения одного языка в другой описан очень хорошо.
Ну и потом, для Европы это, видимо, нормально - степень интеграции там всегда была высока.
3) Не только башкиры претендуют на родство с англичанами. Мне своими глазами приходилось видеть кандидатскую диссертацию об анализе сходства английского и абазинского языков. В заключительной части делался вывод, что происхождение английского языка от абазинского можно считать практически доказанным. К слову сказать, абазинский - это практически тот же абхазский, который вошел в Книгу рекордов Гиннесса редкостным фонетическим составом - на три десятка согласных всего две гласных.
Я в свое время выучил по-абхазски выражение "три бочки сметаны" - там гласной вообще ни одной, одни гортанные звуки. Чисто английское произношение.
4) Спасибо за описание фракталов. Сам процесс последовательного отображения чем-то смахивает на инкапсуляцию и наследование классов в программировании.

Щекну
Как Вы предусмотрительно не закончили стишок про Кавказ и Европу! А то, глядишь, ААВ и этот форум прикроет (как Северный Кавказ, мир его праху).


 
кстати
Четверг, 11 ноября 1999 года, 06:34
Наверх | Предыдущее сообщение | Следующее сообщение | Вниз
Тема: Всем обо всем
E-mail: kstati@yahoo.com

Доброе утро!

1. Разбор личного дела. "Откуда Вы знаете, что Кстати -- это не Марина или Ольга."

Обижаете! Я -- "в меру упитанный мужчина в полном расцвете сил". С усами. Хотя спасибо за "явно профессиональные знания по языку" (увы, всего лишь любитель).

2. У Зализняка слова "шансон" нет. Хотя "шансонетка" и "шансонье" есть. (Между прочим, "шансонье" -- не французское слово, а русское! У них "певец" называется chanteur -- "шантёр".)

Да, а как вам такие "французские" слова образца 1812 года, как шваль (cheval -- лошадь), шантрапа (Je ne chanterai pas -- Я не буду петь) и шаромыжник (cher ami -- дорогой друг)?

3. "Чудовищные" заимствования типа английских "phenomenon/phenomena" и братьям-славянам не чужды. У поляков "музей" будет "muzeum" (причем -- это слово СРЕДНЕГО рода). Но склоняется для нас совершенно непривычным образом: в единственном числе сохраняет свою форму, а вот во множественном изменяется почти по-русски -- muzea (музеи), muzeow (музеев), w muzeach (в музеях) и т. д. Причем это -- не исключение, а общее правило для многочисленных подобных заимствований на -um.

4. О чистоте английского языка. Беру первую попавшуюся книжку (по программированию: Levin, Mason, Brown, "Lex & Yacc") и извлекаю "обычные" слова (или термины, имеющие в том числе и "бытовое" значение): preface, design, compiler, interpreter, application, interest, command, language, candidate, rapid, modification, simple, maintenance, stimulate, imagination, people, use, develop, calculator, mathematical, equation, complex, picture, portable, system, menu, data, base, syntax, second, edition, extensive, revision, major, include, completely, introductory, chapter, grammar, reference. Это все -- с одной только первой страницы предисловия, где всего-то 22 строчки, причем половина -- совсем короткие.

5. Под "откровенно заимствованными" словами я подразумеваю те, где их "чуждое происхождение" ясно и без заглядывания в словарь (конечно, это довольно субъективно). То есть "лошадь", "собаку", "очаг" или "кирпич" мы к ним заведомо не отнесем, "линия", "корона" и "тип" находятся где-то на грани, а вот "метод", "форма", "теория", "музыка" и "принцип" -- искомые. Порой можно пользоваться формальными признаками: буква Ф, "чуждые" приставки (а-, экс-, ко-, ин-, эй- и т. п.) или суффиксы (-ция, -ир-, -изм, -ист, -ер и т. п.), странные звукосочетания (оо, ау, кс, кв, нг).

Интересно, есть ли контрпримеры к такому утверждению: в "исконных" словах должно быть ЦЫ, а в заимствованных -- ЦИ (имена, названия и производные от них не учитываем).

6. Текстам на ярлыках и рекламе доверять (и в смысле правописания тоже) нельзя! Там порой такие перлы попадаются... Например: "Инструкция по эксплуатации пользователя". Про опечатки и ошибки перевода уж и не говорю.

7. В обзоре прессы на www.nns.ru обнаружил забавную заметку:

"Английский язык происходит от башкирского, а башкиры и англичане -- потомки башкодоров, народа, некогда заселявшего Урал от арктического Севера до юга вместе с предками норвежцев, бургундцев, кордов и иранцев. Как пишет газета "Советская Башкирия", такие смелые выводы можно сделать, прочитав книгу Салавата Галлямова "Великий Хау Бен. Исторические корни башкордско-английского языка и мифологии", изданную большим тиражом в Башкортостане на средства Госкомнауки республики. Автор претендует на открытие планетарного значения: он считает, что доказал, будто башкиры и англичане имеют общее происхождение. Исходя из наличия некоторых общих фонетических, грамматических, лексических признаков в башкордском, курдском, английском, французском, финском и других языках, автор делает далеко идущие выводы: эти языки имеют общее происхождение с башкирским или даже происходят от башкирского."


 
Предыдущий | На главную страницу | Наверх | Следующий

Яndex
Google

TopList










Оформление (C) Арнольд