Misha Verbitsky (tiphareth) wrote, @ 2004-02-05 05:48:00 |
Current mood: | tired |
Current music: | Van der Graaf Generator - THE LEAST WE CAN DO IS WAVE TO EACH OTHER |
Black metal nation: What do Norwegian dirtheads and Richard Perle have in common?
Когда мы полгода назад ходили
в поход с drugnaroda,
мною было изобретено следующеее
полезное блюдо.
1. Тарелку рожек или других макарон, но лучше рожек.
2. Банку лосося в собственном соку в эту тарелку. Засыпать
подравкой, сушеной морковкой-петрушкой или другими кореньями.
3. Налить туда полстакана или стакан крепкого чая.
Очень вкусно
Е-мэйл сюда не ходит, уже сутки, может
его починят, может не починят. Я не жду.
Смешная рецензия на книгу "Lords of Chaos"
Мойнихена с еще норвежцем; написал Марк Эймс,
редактирующий Exile. Про Бурзума типа.
А как в regular expressions (Perl, locale мне неизвестна)
отделить русские буквы от нерусских? Я хочу написать regexp
для отделения слов, в которых некоторые русские буквы
заменяются на похожие по написанию латинские, спаммеры
очень любят так писать. В результате экпериментов, я
выяснил, что интервал [а-З] и [а-з], по мнению моего
Перла, включает в себя все английские буквы, а
интервал [ю-Ъ] (соответствующий русским буквам
по версии таблицы КОИ-8) пуст.
Привет
avva 2004-02-04 20:35 (link) | |
Зависит от кодировки, в которой представлен данный русский текст. В самом перле лучше писать на [а-з] или что-то в этом роде, а прямо ставить коды, напр. [\x80-\xff] итп. Тогда не будет никакой роли играть та локаль, в которой бежит сам перл, и это хорошо. Письмо перед обработкой проще всего перекодировать в одну какую-то кодировку, ту же koi8-r, какой-нибудь внешней утилитой, а потом в перле пользоваться регэкспами с шестнадцатеричными кодами внутри, согласно этой кодировке. (Reply to this) (Thread) |
Re: tiphareth 2004-02-04 20:46 (link) | |
Спасибо! У меня переписка идет в koi-8, и обрабатывается Spamassassin-ом. Задача - опознавать все слова, где в одном слове встречаются латинские и русские буквы, типа "Абoнeнтскoe oбслужuвaнue oргaнuзaцuй" Правильно ли я понимаю, что [\xC0-\xff] будет опознавать русские буквы? Вообще хочется найти библиотеку Spamassassin-тестов для кириллического спама. Такие дела Миша (Reply to this) (Parent) (Thread) |
avva 2004-02-04 21:04 (link) | |
Ага, думаю, [\xc0-\xff] это то, что надо. Может, что-то в этом роде: ([\xc0-\xff][a-z])|([a-z][\xc0-\xff]) плюс добавить /i в флагах оператора, чтобы case insensitive и A-Z тоже ловил. Это поймает любое чередование русской буквы с английской внутри одного слова. (Reply to this) (Parent) |
Re: Spamassain libraries bbixob 2004-02-07 11:56 (link) | |
ЛОМИ pdmi.ras.ru ползуется Спамассасиом, и вроде у них он неплохо ловит спамы; впрочем, русских спамов там мало. Вроде админом там сейчас анд at euclid.пдми.рас.ру (Андреи Каишев), я с ним не знаком... пс: спасибо за ответ на вопрос Зильбера; ответил со ссылками я посылал, не знаю, дошел ли. (Reply to this) (Parent) (Thread) |
Re: Spamassain libraries tiphareth 2004-02-08 06:51 (link) | |
Дошел! Я ответил. Спасибо! Такие дела Миша (Reply to this) (Parent) |
Re: tiphareth 2004-02-04 20:57 (link) | |
Да, вроде работает, спасибо body MIXED1_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff]/i describe MIXED1_OBFU_MV Mixed Cyrillics and Latin (for obfuscation) score MIXED1_OBFU_MV 1.5 body MIXED2_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff]*[A-GI-o describe MIXED2_OBFU_MV Mixed Cyrillics and Latin (for obfuscation) score MIXED2_OBFU_MV 2.5 body MIXED3_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff ]*[A-GI-or-z][\xC0-\xff]/i describe MIXED3_OBFU_MV Mixed Cyrillics and Latin (for obfuscation) score MIXED3_OBFU_MV 1.5 Использование H вместо Н и p вместо р встречается в легитимных письмах (из-за Фидо и из-за старого Нортон-Коммандера) Такие дела Миша (Reply to this) (Parent) (Thread) |
avva 2004-02-04 21:06 (link) | |
Здорово. Про H и p я и забыл. Смешно, что они живут до сих пор. (Reply to this) (Parent) (Thread) |
Re: syarzhuk 2004-02-05 03:41 (link) | |
Я предлагаю срочно написать Крылову о том, что два ЖЖ-гения - Авва и Тифарет - с помощью Перла решили главную задачу русских националистов, а именно - отделили русских от нерусских! (Reply to this) (Parent) |
Re: a48 2004-02-05 12:30 (link) | |
а можно попросить все собственные правила? :) (Reply to this) (Parent) (Thread) |
Re: tiphareth 2004-02-08 01:57 (link) | |
Пожалуйста! http://laylah.lenin.ru/spamassassin.c Такие дела Миша (Reply to this) (Parent) |
(Anonymous) 2004-02-04 21:29 (link) | |
А заменой букв ещё можно писать матом в руссру! |
quantum_angel 2004-02-05 01:20 (link) | |
странная история ведь книга Мойнихена, кажется, уже несколько лет тому назад вышла? а ты тоже любишь викернеса? я вот только недавно, что называетсяя, открыл для себя его эмбиентные работы. вовсе это не "недоделанный нью-эйдж", как некоторые критики из лавеевской церкви презрительно цедили. очень высокого уровня интеллигентная электронная музыка. один трек на Filosofem, который был в звуковой дорожке "Гуммо", вообще разносит. 24 минуты полтора примерно аккорда. и еще есть две хорошие группы Satiricon и Bethlehem. прочий блэк перестает быть интересным после третьего физиологического криза. (Reply to this) (Thread) |
Re: satory66 2004-02-05 01:30 (link) | |
... два альбома: Bathory - Under The Sign Of The Black Mark (1987) Dark Throne - A Blaze In The Northern Sky (1991) ..и больше ничегошеньки в BM интересного не выходило. (Reply to this) (Parent) |
Re: tiphareth 2004-02-05 01:42 (link) | |
Да, Кристиан В. зайка. Из всего блэка я тоже только его могу слушать и Darkthrone (ранний). По поводу амбиентных трэков - у него есть хорошие и не очень, Filosofem весь, конечно, гениальный. Такие дела Миша (Reply to this) (Parent) (Thread) |
Re: satory66 2004-02-05 01:53 (link) | |
Filosofem замечательный, Daudi Baldrs и Hlidskjalf немного посасывают. (Reply to this) (Parent) |
chevengur 2004-02-05 06:08 (link) | |
Бурзум чудесный |
ded_mitya 2004-02-05 06:26 (link) | |
Ха! А рецензия действительно смешная. Такое ощущение, что писали герои South Park'a. Хотя поинт есть, конечно. Эмбиентный Викернес - мнэээ. В Hlidskjalf первые два номера ободраны с Клауса Шульце (чье влияние на БМ-щиков очевидно - даже Мэйхем в сыром варианте одного из альбомов сделал его кавер!),остальное в общем-то балласт. Hvis Lyset Tar Oss пожалуй, не хуже Философема будет. В принципе, Викернес и Дарктрон это наше все. Ранние блэкари лабали тот же трэш, только песенки писали не про Пиво-и-Баб, а про Чорта, и зубной пастой мазались, для вящего эффекту. А тебе не попадались злые хохлы Drudkh и Hate Forest? Будь. |
haeldar 2004-02-05 08:16 (link) | |
Миша, а ты не в курсе, где эту книгу можно нарыть в Интернете, причем, желательно - по-русски. С бумажным вариантом я успел ознакомиться, но его у меня забрали по-быстрому. А на лотках в москве ее сейчас найти нереально. Там был особо замечательный пассаж про самую страшную сатанинскую блэк-группу в России: как вы думаете, кто? Коррозия Металла, ага))) Мои респекты авторам! удачи. (Reply to this) (Thread) |
Re: tiphareth 2004-02-08 06:52 (link) | |
Не знаю! Я ее на Амазоне заказывал, по-английски, конечно Такие дела Миша (Reply to this) (Parent) |
azatiy 2004-02-06 05:43 (link) | |
Юронимус круче! |
Perl на службе Родины muchandr 2004-02-06 06:57 (link) | |
Помнится, пытался провести реформу англицкого. ИМХО, следует удалить из него артиклы, как не несущие смысловой нагрузки и доставляющие уйму проблем non-native speakers, особенно русским. В этих целях регулярно фильтровал motd на soda.berkeley.edu следующей коммандой: alias russian "perl -pe 's/(\b)(an?|the)\s*\b/\1/gi'" Зажопили только через месяц :) |
[ Home | Update Journal | Login/Logout | Browse Options | Site Map ]