Misha Verbitsky ([info]tiphareth) wrote,
@ 2004-02-05 05:48:00
Current mood: tired
Current music:Van der Graaf Generator - THE LEAST WE CAN DO IS WAVE TO EACH OTHER

Black metal nation: What do Norwegian dirtheads and Richard Perle have in common?
Когда мы полгода назад ходили
в поход с [info]drugnaroda,
мною было изобретено следующеее
полезное блюдо.

1. Тарелку рожек или других макарон, но лучше рожек.
2. Банку лосося в собственном соку в эту тарелку. Засыпать
подравкой, сушеной морковкой-петрушкой или другими кореньями.
3. Налить туда полстакана или стакан крепкого чая.

Очень вкусно

Е-мэйл сюда не ходит, уже сутки, может
его починят, может не починят. Я не жду.

Смешная рецензия на книгу "Lords of Chaos"
Мойнихена с еще норвежцем
; написал Марк Эймс,
редактирующий Exile. Про Бурзума типа.

А как в regular expressions (Perl, locale мне неизвестна)
отделить русские буквы от нерусских? Я хочу написать regexp
для отделения слов, в которых некоторые русские буквы
заменяются на похожие по написанию латинские, спаммеры
очень любят так писать. В результате экпериментов, я
выяснил, что интервал [а-З] и [а-з], по мнению моего
Перла, включает в себя все английские буквы, а
интервал [ю-Ъ] (соответствующий русским буквам
по версии таблицы КОИ-8) пуст.

Привет



(Post a new comment)


[info]avva
2004-02-04 20:35 (link)
Зависит от кодировки, в которой представлен данный русский текст. В самом перле лучше писать на [а-з] или что-то в этом роде, а прямо ставить коды, напр. [\x80-\xff] итп. Тогда не будет никакой роли играть та локаль, в которой бежит сам перл, и это хорошо. Письмо перед обработкой проще всего перекодировать в одну какую-то кодировку, ту же koi8-r, какой-нибудь внешней утилитой, а потом в перле пользоваться регэкспами с шестнадцатеричными кодами внутри, согласно этой кодировке.

(Reply to this) (Thread)

Re:
[info]tiphareth
2004-02-04 20:46 (link)

Спасибо!
У меня переписка идет в koi-8, и обрабатывается
Spamassassin-ом. Задача - опознавать все слова, где
в одном слове встречаются латинские и русские буквы, типа
"Абoнeнтскoe oбслужuвaнue oргaнuзaцuй"

Правильно ли я понимаю, что [\xC0-\xff]
будет опознавать русские буквы?

Вообще хочется найти библиотеку Spamassassin-тестов для
кириллического спама.

Такие дела
Миша

(Reply to this) (Parent) (Thread)


[info]avva
2004-02-04 21:04 (link)
Ага, думаю, [\xc0-\xff] это то, что надо.

Может, что-то в этом роде: ([\xc0-\xff][a-z])|([a-z][\xc0-\xff])
плюс добавить /i в флагах оператора, чтобы case insensitive и A-Z
тоже ловил. Это поймает любое чередование русской буквы с английской
внутри одного слова.

(Reply to this) (Parent)

Re: Spamassain libraries
[info]bbixob
2004-02-07 11:56 (link)


ЛОМИ pdmi.ras.ru ползуется Спамассасиом, и вроде у
них он неплохо ловит спамы; впрочем, русских спамов там мало.

Вроде админом там сейчас

анд at euclid.пдми.рас.ру (Андреи Каишев),

я с ним не знаком...

пс: спасибо за ответ на вопрос Зильбера; ответил со ссылками
я посылал, не знаю, дошел ли.



(Reply to this) (Parent) (Thread)

Re: Spamassain libraries
[info]tiphareth
2004-02-08 06:51 (link)


Дошел! Я ответил. Спасибо!

Такие дела
Миша

(Reply to this) (Parent)

Re:
[info]tiphareth
2004-02-04 20:57 (link)

Да, вроде работает, спасибо

body MIXED1_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff]/i
describe MIXED1_OBFU_MV Mixed Cyrillics and Latin (for obfuscation)
score MIXED1_OBFU_MV 1.5

body MIXED2_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff]*[A-GI-or-z][\xC0-\xff]/i
describe MIXED2_OBFU_MV Mixed Cyrillics and Latin (for obfuscation)
score MIXED2_OBFU_MV 2.5

body MIXED3_OBFU_MV /[\xC0-\xff][A-GI-or-z][\xC0-\xff ]*[A-GI-or-z][\xC0-\xff]/i
describe MIXED3_OBFU_MV Mixed Cyrillics and Latin (for obfuscation)
score MIXED3_OBFU_MV 1.5

Использование H вместо Н и p вместо р встречается в легитимных
письмах (из-за Фидо и из-за старого Нортон-Коммандера)

Такие дела
Миша

(Reply to this) (Parent) (Thread)


[info]avva
2004-02-04 21:06 (link)
Здорово. Про H и p я и забыл. Смешно, что они живут до сих пор.

(Reply to this) (Parent) (Thread)

Re:
[info]syarzhuk
2004-02-05 03:41 (link)
Я предлагаю срочно написать Крылову о том, что два ЖЖ-гения - Авва и Тифарет - с помощью Перла решили главную задачу русских националистов, а именно - отделили русских от нерусских!

(Reply to this) (Parent)

Re:
[info]a48
2004-02-05 12:30 (link)
а можно попросить все собственные правила? :)

(Reply to this) (Parent) (Thread)

Re:
[info]tiphareth
2004-02-08 01:57 (link)

Пожалуйста!
http://laylah.lenin.ru/spamassassin.cf.txt

Такие дела
Миша

(Reply to this) (Parent)


(Anonymous)
2004-02-04 21:29 (link)
А заменой букв ещё можно писать матом в руссру!

(Reply to this)


[info]quantum_angel
2004-02-05 01:20 (link)
странная история
ведь книга Мойнихена, кажется, уже несколько лет тому назад вышла?

а ты тоже любишь викернеса? я вот только недавно, что называетсяя, открыл для себя его эмбиентные работы. вовсе это не "недоделанный нью-эйдж", как некоторые критики из лавеевской церкви презрительно цедили. очень высокого уровня интеллигентная электронная музыка. один трек на Filosofem, который был в звуковой дорожке "Гуммо", вообще разносит. 24 минуты полтора примерно аккорда.

и еще есть две хорошие группы Satiricon и Bethlehem. прочий блэк перестает быть интересным после третьего физиологического криза.

(Reply to this) (Thread)

Re:
[info]satory66
2004-02-05 01:30 (link)
... два альбома:
Bathory - Under The Sign Of The Black Mark (1987)
Dark Throne - A Blaze In The Northern Sky (1991)
..и больше ничегошеньки в BM интересного не выходило.

(Reply to this) (Parent)

Re:
[info]tiphareth
2004-02-05 01:42 (link)

Да, Кристиан В. зайка. Из всего блэка я тоже только
его могу слушать и Darkthrone (ранний).

По поводу амбиентных трэков - у него есть хорошие
и не очень, Filosofem весь, конечно, гениальный.

Такие дела
Миша

(Reply to this) (Parent) (Thread)

Re:
[info]satory66
2004-02-05 01:53 (link)
Filosofem замечательный, Daudi Baldrs и Hlidskjalf немного посасывают.

(Reply to this) (Parent)


[info]chevengur
2004-02-05 06:08 (link)
Бурзум чудесный

(Reply to this)


[info]ded_mitya
2004-02-05 06:26 (link)
Ха!
А рецензия действительно смешная. Такое ощущение, что писали герои South Park'a. Хотя поинт есть, конечно.

Эмбиентный Викернес - мнэээ. В Hlidskjalf первые два номера ободраны с Клауса Шульце (чье влияние на БМ-щиков очевидно - даже Мэйхем в сыром варианте одного из альбомов сделал его кавер!),остальное в общем-то балласт.

Hvis Lyset Tar Oss пожалуй, не хуже Философема будет. В принципе, Викернес и Дарктрон это наше все. Ранние блэкари лабали тот же трэш, только песенки писали не про Пиво-и-Баб, а про Чорта, и зубной пастой мазались, для вящего эффекту.

А тебе не попадались злые хохлы Drudkh и Hate Forest?

Будь.

(Reply to this)


[info]haeldar
2004-02-05 08:16 (link)
Миша, а ты не в курсе, где эту книгу можно нарыть в Интернете, причем, желательно - по-русски. С бумажным вариантом я успел ознакомиться, но его у меня забрали по-быстрому. А на лотках в москве ее сейчас найти нереально. Там был особо замечательный пассаж про самую страшную сатанинскую блэк-группу в России: как вы думаете, кто? Коррозия Металла, ага))) Мои респекты авторам!
удачи.

(Reply to this) (Thread)

Re:
[info]tiphareth
2004-02-08 06:52 (link)

Не знаю! Я ее на Амазоне заказывал,
по-английски, конечно

Такие дела
Миша

(Reply to this) (Parent)


[info]azatiy
2004-02-06 05:43 (link)
Юронимус круче!

(Reply to this)

Perl на службе Родины
[info]muchandr
2004-02-06 06:57 (link)
Помнится, пытался провести реформу англицкого. ИМХО, следует удалить из него артиклы, как не несущие смысловой нагрузки и доставляющие уйму проблем non-native speakers, особенно русским. В этих целях регулярно фильтровал motd на soda.berkeley.edu следующей коммандой:

alias russian "perl -pe 's/(\b)(an?|the)\s*\b/\1/gi'"

Зажопили только через месяц :)

(Reply to this)


(Post a new comment)


[ Home | Update Journal | Login/Logout | Browse Options | Site Map ]