Sply Splyeff

Recent Entries

You are viewing the most recent 25 entries.

2009-06-27

19:13: языковая картины мира
По поводу "Аспекты языковой картины мира. Итальянский и русские языки." Учитывая, что все примеры и противопоставления показываются на итальянском, без знания итальянского пользы от чтения будет мало. Так что рекомендация читать всем - ошибка. Поискал сейчас есть ли что такого же типа с английским, но не нашел.

А наверное, интереснее было бы читать не всеобъемлющие сведения об всех языках, а именно сравнение своего языка и чужого, который достаточно хорошо знаешь. В таком сравнении начинаешь понимать лучше и чужой, и свой.
04:12: Ю.А. Рылов, Аспекты языковой картины мира. Итальянский и русские языки.
Раскопал сейчас книгу и читаю с огромным интересом. Книгу купили больше по-приколу, не всматриваясь внимательно в содержание, а из-за забавных для нелингвиста вещей типа "В тосканском диалекте неопределенно-генерализированная форма может сочетаться с местоимением noi "мы": Noi si va al cinema "Мы идем в кино".

А книга оказалась натуральным сокровищем. Те вещи в схожести/разности итальянского с русским, которые постоянно замечаешь и о которых размышляешь сам, которые интересны, и помогают лучше понимать чужой язык, но в учебниках об этом ни слова. Преподаватели языка, кстати, тоже этим почти не пользуются в обучении. У меня это в некоторой степени случилось только когда я учил язык в Болонье и попросил учителя объяснять этимологию некоторых слов и фраз. Когда он увидел, что это реально работает, стал сам в подходящих случаях раскапывать структуры глубже.

Вот не конкретно про те уроки, а просто наглядный пример того, как такое "копание" помогает учить язык лучше. Одна из самых частых проблем для русский, которые учат итальянский и английский - прошедшее совершенное время. В русском используется один глагол, а у них вспомогательный глагол и причастие. В русском: "я увидел море", у них, в дословном переводе: "я имею виденным море", что можно разложить на нормальное объяснение: на данный момент я имею такое положение дел (картину мира?), в котором море мной увидено. Поняв этот принцип построения, а не заучив тупо have seen / ho visto, становится легче строить или понимать такие или более сложные обороты. Кстати, возможно из-за этой разницы в "увидел/имею виденным" мне как русскому было трудно сходу въехать в концепцию "мира" у агентов англоязычного Норвига. Там после каждого события возникал новый мир, как результат предыдущего мира, к которому применено произошедшее событие.

А тут целая книга про то, как строятся и как отличаются практически все части итальянского и русского. Раньше только на уровне ощущений было понимание про трудности перевода. Анка читала на итальянском "Мастера и Маргариту" и набрала большую коллекцию ляпов. Я, кажется, писал, про то как "я никогда не закусываю" на итальянском превратилось в "я никогда не ем". А у итальянцев и слова нет "закусывать". В словаре Lingvo есть фразеологизм "mangiare sopra", но мы человек десять спросили (тема ведь важная), и никто такого значения не знает. Видимо, от того, что они никогда не закусывают, граппу потягивают мелкими глотками. На счет водки увидеть не довелось, но недавно в книжке прочитал как коренной венецианец пил водку из бокала. Так что ясно, такие люди не закусывают.

Что автор зрит в корень становится понятно после пары предложений в самом начале.

... различия в отображении языковой картины мира имманентно заложены в лексической системе языка. ... Этим объясняется наличие в языке эскимосов обширной группы слов, обозначающих различное состояние льда, а в арабском языке - номинации многочисленных разновидностей верблюда. ... в русской лексике широко - гораздо шире, чем в английской - представлены такие сферы, как эмоциональность, иррациональность, любовь к морали, отражающие наиболее яркие черты русского национального характера.

Могу сюда добавить, что в итальянском больше, чем в русском, слов о вкусе еды.

Странно, что имено с таким названием, "языковая картина мира", столкнулся только сейчас. Конечно, все вещи, которые в нее входят тем или иным образом часто упоминаются, но именно так, чтобы это было систематизировано и названо "языковой картины мира" только сейчас вижу.

Книга может быть интересна любителям итальянского языка, переводчикам, разработчикам машинного перевода и IR. Хотя лингвистам это, может быть, на первом курсе дают и им это баян.

2009-06-18

04:19: http://ailev.livejournal.com/694688.html?style=mine
Куча интересного, особенно, про инвестфонды, которые сами хотят создавать стартапы (п.3), возвращение "тяжелой" логики благодаря дешевой мощности (п.5).

По поводу инвестфондов, самим искать идеи и потом нанимать команды для реализации. Сильно напоминает то, что было в России в начале 2000-х. Тогда причиной был недостаток денег вообще, сейчас недостаток денег, которые не жалко потерять. Результат скорее всего будет такой же, в смысле никакой. Над чужими идеями даже хорошие команды не могут работать также хорошо, как над своими. Разве что идея супергениальная, например, построить нефтеперерабатывающий завод.

Хотя сразу возникает идея стартапа, зарабатывающего на таких фондах - специальные препараты и психотехники, позволяющие убеждать людей в том, что то, над чем они работают, является их идеей, которую они страстно хотят реализовать. Концепция, наверняка, сто раз описана в каких-нибудь антиутопиях и киберпанках, но без шуток, вполне реалистична.

2009-06-16

18:28: antispam blacklisting malicious machines
А не проверял ли кто, насколько может быть эффективным автоматом вносить в блэклист src IP для всяких сканнеров? Что-то типа спамхаусовского XBL, только более фашистский. Пришел пакет на несуществующий ip или закрытый порт, и его отправителя сразу за каждый пакет на сутки в локальный dnsbl. Интересно, насколько сильно они могут пересекатся с рассыльщиками.

2009-06-12

20:33: opensource, гибкость, догматизм, RFC, quagga
Вот что хорошо в опенсорсе - нашел хорошую вещь, работает как надо, допилил мелочь, которая нужна только тебе, и получил полное счастье. И когда делаешь что-то сильнонестандартное, допиливать приходится по-мелочи, но часто. Большинство даже назад не вольют, т.к. либо никому не нужно, либо нарушает RFC, эстетические идеалы мeйнтейнера или еще что-то. А иногда лезешь допиливать слишком рано.

Вот в quagga по rip анонсы принимает только из directly connected сетей, которые трактуются как совпадающие по префиксу с собственным адресом на интерфейсе. Вот если ты просто ip в интерфейс зароутил, это уже кощунство, от него ответ не принимается.

Рука привычно тянется к напильнику. Но тормозит лень и догоняет мысль, что ты привык к freebsd, а в линуксе ведь есть новый священный грааль - утилита ip. И точно, там можно вместо того, чтобы зароутить ip в интерфейс (ip route add 1.1.1.2/32 dev eth0), прицепить его как point-to-point (ip addr add 1.1.1.1/32 peer 1.1.1.2/32 dev eth0) и это в корне меняет дело. quaggе такое соседство RFC не нарушает и этих соседей она видит и привечает. Напильник отменяется.

А в quagga на freebsd легально и RFC-совместимо это, видимо, не сделать. Если я правильно понял, там в структурах ядра peer address для алиасов интерфейса совсем не предусмотрен.

2009-06-06

16:01: do panic
Вчера был в тесном контакте с пушным зверем пол-ночи ловил хакеров. Заметил, что на несколькоих машинах часть системных файлов (/bin, /usr/bin, /lib) имеют размер чуть больше, чем в дистрибутиве, из которого они были установлены, при той же дате модификации. Начали уже планировать большую зачистку и реинсталляцию.

Поставил из дистрибутива несколько хонипотов, чтобы понять что и как происходит. Утром смотрю, файлы изменились. В tcpdump несколько портсканов, но безвредных. А файлы изменились.

Пошел смотреть, что у нас в кроне. Ага, а там есть ежедневный запуск скрипта с многообещающим названием. Так я открыл для себя prelink, линуксовскую фишку для ускорения старта программ и увеличении эффективности кол-ва shareble memory. Который для этого меняет код в ELFовских исполняемых файлах и библиотеках.

Какие блин прыжки с парашютом, когда тут адреналин в больших количествах и бесплатно.

2009-05-27

02:39: Есть у нас один питерский оператор связи, с которым периодически нужно документами обменяться. Обычное дело - отправлять их по почте. Но за год мужик с их стороны, с которым мы работаем, несколько раз предлагал вместо этого приехать к нам в офис привезти или забрать документы. Было неудобно напрягать человека ехать к нам на другой конец города, хоть он и говорил, что либо по пути проезжать будет, либо клиенты еще какие-то недалеко. Но, обычно, как-то по другому все-таки решалось. И вот в понедельник нужно было срочно отдать ему документ. Я в это время работаю дома и он едет ко мне. Приехал, звонит: остановился там-то. Ок, говорю, сейчас выйде, какая машина? Отвечает: Хаммер. И тут я, кажется, все понял.

2009-05-24

02:28: Почистил трекбол. Инерции хватает бросить курсор из центра экрана в угол. Такое ощущение легкости теперь.

2009-05-23

22:39: амазон, линукс и масло
Хорошо, что есть Амазон. Как попадешь на неожиданные косяки, так идешь к ним и смотришь, а как они в EC2 это обходили. Особо это не афишируют, но по AMI найти информацию не трудно. И потом видишь, что куча линуксов, которые у них работают, используют на самом деле всего лишь несколько веток ядра. Например, релиз Ubuntu 9 для EC2 работает на более старом ядре из дебиана.

А на ХО меня не будет, о чем жалею. Хоть бы отдохнул децл, почти на природе.

Есть хорошее решение мазать масло на слишком мягкую булку - засушить ее в тостере.

Самый легкий способ заставить юникс "быстро грузиться" - стартовать getty сразу же после монтирования корневой fs, а все остальные вещи, типа поднятия сетки, чтобы шли в фоне. Но если так не делают, значит это никому не нужно.

2009-05-21

23:43: Несколько дней работал, злобно стуча по клавишам. Такая вполне конкретная злость, вызванная предметом работы. Помогает решать проблему брютфорсом. Как и листик с карандашем, которым вычеркиваешь неудачные варианты. Злость сужает поле зрения (дерево выбора), помогая не тратить время на широкие бесплодные поиски. Особенно полезно, когда работы много. Главное, злиться тогда, когда это имеет смысл.

2009-05-05

03:07: legalize
Я все удивлялся, когда был в Лиссабоне, как это так на главной улице в разгар дня пушеры орут тебе с противоположной стороны, предлагая кокаин. А у и них, оказывается, с 2001 года хранение и употребление всего, заканчивая героином - административная ответственность. Уровень потребления сейчас самый низкий в Европе. Странно, что у них, кажется, до сих пор еще существует запрет на аборты.

Drug Decriminalization in Portugal:
Lessons for Creating Fair and Successful Drug Policies


via [info]ailev

2009-05-01

01:18: /sbin/init & pid 1
Сегодня настраивал самосборные initrd и кучу времени потерял, пытаясь понять, почему это у меня руками не запускается init. Т.е. я для отладки в стартовом скрипте шелл запускал, а потом уже exec /sbin/init. Он мне все время выдавал про write timeout на /dev/initctl. Уже полез в исходниках искать, зачем он ему нужен и что он хочет писать. Под конце вспомнил, что ходил по этим граблям несколько месяцев назад, в точно такой же ситуации.

Линуксовский SysV init - он двуликий янус. Кроме основного и единственного init, можно в любом режиме запускать тот же самый /sbin/init, давать ему аргументом runlevel, и тот через pipe /dev/initctl передает его главному init. Выбор роли после старта основывается только на getpid() - если == 1, значит я и есть главный init. Если другой, то я - init на побегушках, который должен открыть /dev/initctl и сказать туда что-то для главного init.

При старте где-то форкался лишний шелл и запуская из консоли exec /sbin/init, он выполнялся уже с pid!=1. Но вместо того, чтобы упасть с сообщением о невозможности стать инитом, он менял роль и падал с совершенно другим сообщением. Вот она, душа PHP, в сердце линукса зашита.

Самое обидное, что ходил уже по этим граблям несколько месцев назад. Помучался, разобрался, позлился и забыл. Сейчас, записав, запомню лучше.
00:15: linux: install grub on an image file with the loop device
Read more... )

2009-04-30

13:19: С Con te partiro у меня есть забавный личный глюк памяти. Я ее пою, когда никого рядом нет. С ходу, почти никогда не могу спеть правильно начало, забываю мелодию. Но если спеть припев, все становится на место и начало снова получается. Где-то минут пятнадцать еще в памяти держится, потом снова теряется.
12:40: опера
Есть такой итальянский оперный певец Андреа Бочелли, человек с интересной судьбой. В известные люди его вывел старый итальянский рокер Цуккеро, который взял Бочелли на подпевки выступать с собой на концертах. На них дуэтом с Цуккеро он пел цуккеровскую Miserere и соло Nessun Dorma. Потом он выступил на фестивале Сан-Ремо и победил в секции начинающих. Далее карьера пошла вверх - его стали приглашать петь в классической опере и он стал выпускать поп-алльбомы. Наверное, самая известная его песня Con te partiro.

Здесь есть его еще немного, несколько неаполитанских песен, Аве Мария - словом, типичный итальянский поп.

Кстати, сравнивая Con te partiro и Nessun Dorma становится понятно совершенно отчетливо, что не дело слушать оперные арии как песни, отдельно от оперы. Исключения в виде арий, настолько интересных, чтобы быть способными существовать самостоятельно, бывают очень редко. Автору нужно выдать на гора пару часов музыки, а хиты невозможно генерировать пачками.

2009-04-13

23:55: сколько нам открытий чудных
Можно считать, что заработал черный пояс по OSPF. После того, как часть сети намеренно вытащил из OSPF и посадил под RIP, и получилось все, что требовалось, натурально почувствовал просветление.

Предвижу, что если пойму, как уйти от RIP и сделать все на чистом OSPF, это будет следующий пояс.

2009-04-08

03:24: 2 причины, по которой нумерованные перечисления удобны для чтения
Они экономят время читателя.

1. Нумерация заставляет автора структурировать текст и показывает читателю его структуру. Это позволяет быстро, без полного прочтения понять смысл пункта и решить - есть ли что-то ценное, ради чего можно вчитаться, или это боян и можно переходить к следующему пункту.

2. Естественным образом самые важные пункты идут вначале и если первые пункты оказались боянами, отсюда следует, что все остальные будут бояны в еще большей степени и их можно не читать вообще.

Это способ организации текста идеален для тех случаев, когда текст настолько лаконичен, что заголовок для него был бы избыточен. Но не настолько прост и короток, чтобы уместиться в один абзац. Нумерация создает супер-абзацы. Иерархическая нумерация для сложных текстов еще лучше.
00:21: подводная часть облака
Интересно, что при перечислении, чего хорошего есть в облаках, один из пунктов возникает реже всего - пункт про уменьшение тяжести аварий. Для многих это побочный, вынужденный эффект, вызванный необходимостью адаптировать систему под старт/стоп инстансов или смену профиля работы сервера.

Причина, видимо, в том, что сейчас основная масса облакопоклонников состоит из стартапщиков, у которых кол-во используемого оборудования еще слишком мало для того, чтобы стоимость восстановления составила заметную цифру. И самая часто используемая операция в облаке у них - это добавление к системе новых серверов.

А больших проектов, использующих большие облака, в которых каждую неделю что-нибудь ломается, намного меньше. И они, в силу заматерелости, занятости или NDA, о своих внутренних делах говорят мало.

2009-04-07

00:36: как устроены облака
На прошлой неделе общался с прогрессивными веб девелоперами. Рассказал в общих чертах как устроены у нас облака и что с ними можно сделать. Получил от одного резолюцию: "детский сад, вот мы амазоном пользуемся - это круто".

Дальше был обоснование - рассказ о том, как устроен амазоновский EC2. У них, оказывается, стоят несколько айбиэмовских мейнфреймов, на которых крутятся юзерские инстансы. Инстансы эластичны и если кому-то нужно больше ресурсов, он через панель управления масштабирует инстанс хоть целиком на весь мейнфрейм. Что очень дешево, удобно и упрощает разработку, т.к. не нужно затачивать код для многосерверной работы. Они периодически этим пользуются, когда увеличивается посещаемость, в смысле, масштабируют в 2-4 раза.

Самый смешной анекдот за последний месяц.

2009-04-02

17:20: Вчера был в Туннеле. Заходил на танцпол DnB - небольшая комната, в которой хрен знает сколько КВт звука. Акустический вариант душа Шарко. Вот и заходил на пару минут - принять сеанс. В наушниках, оказывается, звучит намного приятней. Странно было то, что танцевала только четверть народа, остальные стояли у стен и впитывали вибрации.

После выхода в ушах звенело еще пару часов.
17:08: день после
Сегодня глючный день, одновременно случилась куча не связанных между собой проблем - не читаются файлы, падают каналы, горят блоки питания, перестает ходить почта. Началось, правда, вчера вечером. Часть проблем сама собой рассосалась, что оставляет еще и осадок.

Кажется, такие же проблемы случились и у какого-то ботнета, т.к. куда-то пропала большая часть спама.

2009-03-24

00:56: Intel SMM attack
http://invisiblethingslab.com/resources/misc09/smm_cache_fun.pdf

Дырка неопасная, но интересная. Особенно интересно, как эту дырку нашли.
Потенциальную уязвимость нашел несколько лет назад сотрудники Интела
и послали заявки на патенты на методы решения проблемы. После этого
процессоры получили возможность защиты от этой уязвимости, но
в BIOS дырки остались.

-----цитата
Interestingly the very same cache poisoning
problem we abuse in our attack against SMM has
been identified a few years ago by Intel employees,
who even decided to describe it in at least two
different patent applications. We haven't been aware of
the patents before we discovered the attack — we never
thought a vendor might describe weaknesses in its own
products and apply for a patent on how to fix them,
and still not implement those fixes for a few years…
The patents turned out, however, to be easily
"googlable" and it would be surprising that nobody
else before us, and Loic Duflot, have created
working exploits for this vulnerability.
-----конец цитаты


via [info]viliar

2009-03-21

14:57: l = i
В итальянском языке есть много слов, которые отличаются от эквивалентных слов в родственных языках и латыни заменой l на i. В итальянском - bianco, piazza, pianta, в латинском, испанском, французском, португальском, английском, немецком - blanc, blanco, platea, plaza, place, plaz, platz, plantae, plant, planta, plante.

Напрашивается анекдотическая история языка - кто-то при переписывании перепутал и поставил лишние точки над буквами l, которые превратились в i. Малореальный вариант, конечно. В реальности это, скорее всего, анатомические особенности тосканцев, у которых не получались сложные движения языком и они, чтобы не заморачиваться чрезмерно, упростили произношение.

2009-03-13

22:22: mysql query cache tips - таблицы преселектов
Мощная штука, но есть одна деталь, сильно уменьшающая пользу от кэша. Любое изменение любой таблицы из запроса выбрасывает все запросы из кэша. Но есть несложный прием, позволяющий за счет некритичной рассинхронизации содержать query cache намного эффективнее. Держать отдельные таблицы в качестве поставщиков данных для самых частых, но не критичных к свежести информации запросов. Которые наполнять с некоторой периодичностью, например, раз в 10 минут. При больших объемах данных можно держать и отдельные pre-selected таблицы по какому-то частому условию. И, конечно, денормировать.

Живой пример. Есть таблица wishes, имеющая поле visible := public | visible | friends-only | private. Когда для незалогиненного юзера (включая поисковых роботов) показывается лента, генерируемая по этой таблице, ко всем запросам добавляется условие public = visible. И запросы такие составляют почти половину от всех.

Убиваем двух зайцев с минимальными изменениями так:
- раз в 30 минут создаем пустую таблицы wishes_public, в которую выбираем все данные из wishes по условию visible = public
- в рельсах создаем новый класс модели WishesPublic
class WishPublic < Wish
set_table_name 'wishes_public'
end
и везде, где показывается публичная часть сайта, вместо класса Wish указывается WishPublic.

Если стремиться к сверхоптимизации, то можно было бы снимать в wishes_public индекс с поля visibe и убирать его из запросов, но это копейки по сравнению с основным эффектом. Разница в скорости селекта - от 4 до 50 раз в зависимости от типа запроса. Плюс к этому эффективность query cache повышается с 10% до 55% cache hit rate.
22:16: На прошлой неделе из Васеньки еще пару капель выдавил - уменьшил число fcgi-процессов до 5 и убрал разделение по характеру работы. Раньше были два класса - один для чистого RoR, второй для Ruby+ImageMagick. Разделение было из-за того, что прослойка ImageMagick была кривая и генератор картинок очень часто падал в корку. Резко высвободившиеся 2 Гб памяти сотворили большое чудо. Теперь и яху можно пускать пастись, хотя трафика с него - ноль.