неизменяемость прошлого

Если вам мешает отсутствие delete/update в ClickHouse, подумайте, может вам можно немного изменить подход к данным, и тогда это одновременно решит две головные боли.
Какую еще проблему дают delete и update? В аналитике эти операции - это изменение прошлого. И результат, который вы получили за какой-то период до апдейта уже будет невоспроизводим (хотя многие не понимают, насколько это плохо).
Вместо delete/update можно версионировать изменения - просто добавлять в таблицу еще одну колонку с временем, с которого данные изменились. Например, для страны юзера сохранять в таблицу также время, когда он поменял страну. И если за год 20% массово мигрируют в другую страну, у вас не окажется неконсистентной, глючной аналитики.
И это всего лишь усложнит однократную настройку экспорта из OLTP.

Рецепт, кстати, подходит к большому числу других задач - и к пакетированию софта или конфигураций, и к тренировке ML моделей. Тотальное версионирование и блокчейн.

Про хардлинки на симлинки

Если файловая система имеет концепцию inode и хардлинков, то хардлинки могут быть на все, на любые типы: файлы, каталоги (с ограничениями), симлинки, fifo, dev nodes.

На симлинки, соответственно, тоже. Их нормально сохраняют cp, rsync, tar. Но вот пользы от них совсем мало. И, действительно, чревато косяками.

Например, если симлинк - относительный, то создав новый хардлинк в другом уровне файловой иерархии, через новый хэрдлинк симлинк ресолвиться будет неправильно. И, в отличие от файла, где можно изменить содержимое, и новый контент будет у всех хардлинков, нельзя изменить аналогично содержимое симлинка (его таргет), чтобы чтобы оно изменилось для всех. Для симлинка это полезное поведение.

А единственная польза - inode экономить. Например, редкий use case, когда из-за cross-device приходится использовать симлинки. И если есть много дублирующихся файлов, то дедупликацию делать и для симлинков. Файловый кэш и disk io экономит.

Про продукт менеджеров

Летом через линкедин постучалась девица из стартапа, занимающегося каким-то продвинутым поиском консалтеров. Говорит, у них есть клиент, которому нужна моя телефонная консультация относительно задорого. Меня они как-то нашли и опредилили, что это то, что нужно. Был несколько вопросов по телефону, чтобы удостовериться, что они попали ко мне по адресу. И потом общением с заказчиком - там два мужика по телефону.

Оказалось, люди оценивают перспективы запуска нового продукта. И у меня, как у потенциального клиента такого продукта, хотят узнать, какие проблемы я сейчас имею, как их решаю, что есть на рынке из решений, и что из проблем, действительно, важное. Вопросы все по делу.

Я только не смог понять, то-ли это такой скрупулезный product manager у них оказался, то-ли это потенциальный инвестор хотел перспективы какого-то стартапа оценить. Но, вообще, очень интересная мысль общаться с потенциальными клиентами через разновидность рекрутингового сервиса. А может быть это боян и все уже сто лет так делают, не знаю.

(no subject)

Как вы думаете, для чего может использовать Machine Learning команда гоночной яхты?

(no subject)

На счет аэропортов я думаю, что идея отличная для тренировки питчей "на кошках". Я б реально потренировался. Конечно, в электричках питчить еще лучшая тренировка, но я пас.

стартапы питчат в аэропортах

ADP (Аэропорты Парижа) придумали раз в неделю проводить в бизнес-залах Орли и ДеГолля питч-сессии стартапов. Видимо, из расчета, что вот сидит там куча делового народа, скучает, время убивает. А тут раз - и стартаперы им интересные варианты проинвестировать толкают.


Every Thursday at the Paris airports, passengers engage with startups through a series of presentations from budding entrepreneurs in one of five business areas, where smart work stations are available for passenger use. Thus far, 165 startups have taken advantage of this pitch-fest.

NVIDIA vs Intel для deep learning, резюме

NVIDIA GPU лучше по производительности для тренировки DL-моделей, Intel CPU лучше по скорости для инференса, когда задержки на передачу данных в GPU и обратно становятся важны.