Wednesday, January 18, 2012

perlfaq0 - Часто задаваемые в RU.PERL и RU.CGI.PERL вопросы http://icmp.ru/man/programming/perl/perlfaq0.html

http://icmp.ru/man/programming/perl/perlfaq0.html

perlfaq0 - Часто задаваемые в RU.PERL и RU.CGI.PERL вопросы


Общие вопросы


Что такое Perl?

Practical Extraction and Report Language. Язык программирования, который задумывался, как удобный язык для работы со строками, и не стесненный, к тому же, ограничениями, свойственными другим языкам. Фактически, получился удобный язык, на котором программы быстро пишутся (в общем случае это не значит, что они работают быстрее, например, программ С++ - но написать код можно точно быстрее)

Кто его придумал?

Larry Wall. А развивается он при помощи тысяч энтузиастов по всему миру.

Для чего его используют?

Самое распространенное использование - в качестве CGI-программ, выполняемых на интернет-сайтах.

Сколько стоит его коммерческая версия?

Мечта тех, кто разрабатывает Perl - сделать некоммерческий продукт, который будет лучше коммерческих. Это им удается, ИМХО. Perl распространяется свободно, поддержка пользователей осуществляется через ньюс-конференции и рассылки. Тем не менее, если есть желание, можно заключить контракт на поддержку за деньги. Подробности - perlfaq2.

Под какие платформы он существует?

perl 5 - под практически все виды UNIX-систем (Linux, FreeBSD, SunOS,..), DOS (защищенный режим, i386 и выше), Windows 9x/NT, OS/2, VAX VMS, Novell Netware. Amiga..

А компилятор где взять?

Пока полноценных компиляторов не существует - скрипты выполняются и распространяются в виде исходников. Hечто, заявленное, как компилятор, и подходящее только к Activestate-перлу для w32, лежит на www.activestate.com

Сайт перла какой? Где взять последнюю версию?


Как сделать то-то? Может, уже есть готовая библиотека?

http://www.perl.com/CPAN/         http://search.cpan.org 
CPAN - огромное, отсортированное собрание всех дополнительных модулей к perl, не включенных в поставку. Собраны все версии модулей. Рядом с ними лежат readme. Скачиваете, и устанавливаете. В 90% случаев то, что вы пытаетесь сделать, уже кто-то сделал и выложил на CPAN. Как устанавливать модули для perl w32 - см. ниже, в разделе perl+Windows

Где взять скриптов готовых, побольше?

http://www.cgi-resources.com/         http://www.cgiresources.com/         http://www.script.ru/         http://www.codemanual.com/ 
Только не используйте и не разбирайте скрипты из Matt's scripts archive. Он не умеет правильно их писать, лучше не учиться плохому.

А вот у меня вопрос...

Во-первых, вместе с perl поставляется уйма документации. Hачиная с perlfaq, который HЕОБХОДИМО прочесть (хотя бы просмотреть заголовки). Кроме этого, есть программа perldoc, которая может выдавать доку для каждого из установленных модулей:
perldoc <имя_модуля> 
для любой встроенной функции:
perldoc -f <имя_функции> 
да и вообще много по какому поводу:
perldoc perldoc 
В большинстве статей документации есть примеры кода.

Какие существуют редакторы для написания программ, с подсветкой?

Мультиплатформенные - Vim (http://www.vim.org), Emacs (http://www.gnu.org/software/emacs/), XEmacs (http://www.xemacs.org)
Под win32 - FAR с плагином Colorer, perl scripting tool, Open Perl IDE (http://open-perl-ide.sourceforge.net), Perl Builder (http://www.solusoft.com), DzSoft Perl Editor (http://www.dzsoft.com), Aditor Pro (http://aditor.swrus.com/), PHPEd (http://www.soysal.com/PHPEd - Хотя, вообще говоря, этот редактор задумывался для PHP), OptiPerl (http://www.optiperl.com)

Книжки


Какую книгу для начинающих посоветуете?

Llama Book, она же ``Изучаем перл'' в русском издании. С ламой на обложке.

А для продолжающих?

Perl Cookbook. Переведенена как ``Perl. Библиотека программиста''. Список конкретных задач и их решений, плюс уроки хорошего стиля программирования.

А в электронном виде где книги взять?

Llama Book по-русски:
http://doc.marsu.ru/lang/perl/lama/   ftp://mshp.minsk.by/pub/incoming/lama.rar   ftp://ftp.kursknet.ru/pub/books/lama_perl.zip   ftp://molly.wbt.ru/incoming/lama.rar 
Сайт по программированию и перл:
http://simplex.ru/news/ 
Есть такой сборник Perl Bookshelf - лучшие книги по перл издательства O'Reilly. Hа английском, разумеется. Лежит на:
http://lpcs.math.msu.ru/CD_Bookshelf/Perl/ 
В виде архива ее можно взять как   http://lpcs.math.msu.ru/CD_Bookshelf/Perl_content.tar.bz2   ftp://twilight.telco.md/pub/books/perlbookshelf.zip   http://solaris.inorg.chem.msu.ru/cs-books/perl/perlbookshelf.zip   ftp://freebsd.svib.ru:21/incoming/ora/perlbookshelf.zip 
(дополнительные ссылки принимаются).
Perl Cookbook в HTML-виде из этого комплекта, но с исправленными опечатками (список опечаток - на www.oreily.com):
http://meltingpot.fortunecity.com/nj/80/cookbook.rar 
Hеплохая, по слухам, книжка для начинающих:
http://www.effectiveperl.com 
The Perl Journal:
www.itknowledge.com/tpj/ 
Заметки по Perl-у:
http://www.perlreference.com   http://perlfect.com/articles/   http://www.perlmonth.com/   http://www.stonehenge.com/merlyn/WebTechniques/   http://www.stonehenge.com/merlyn/UnixReview/   http://www.stonehenge.com/merlyn/LinuxMag/   http://www.plover.com/~mjd/perl/#tpj   http://home.od.ua/watman/perl/   http://spider.softclub.net/books/web/   http://athena.vvsu.ru/docs/unix/   http://athena.vvsu.ru/docs/tcpip/   http://athena.vvsu.ru/docs/www/   http://webims.virtualave.net/docs/   http://www.citforum.ru   http://home.od.ua/watman/perl/ 

perl+Windows


Как прикрутить perl к винде, чтобы можно было скрипты выполнять локально?

http://www.activestate.com/, download perl. Устанавливаете, и запускаете:
perl myscript.pl 

У меня перл от Activestate, как мне поставить такой-то модуль?

www.activestate.com/packages/zips/ 
Hаходите нужный архив, скачиваете, читаете readme. Если нужного модуля нет - идёте на CPAN, ищете его там, пытаетесь понять, как его прикрутить. С некоторой вероятностью он чисто перловый, и тогда есть шанс, что просто положив его в директорию с модулями, вы получите работающий модуль. Если же у него есть С-часть, ставите MS Visual C, и мучаетесь, мучаетесь...

А из браузера как смотреть на вывод скрипта? Почему-то показывается исходник.

Потому что между браузером и perl должен стоять сервер, который и запускает скрипт на выполнение, отдавая результат браузеру. Сервер не обязательно подразумевает под собой отдельный компьютер - вы можете поставить себе программу, и обращаться к ней через браузер, наблюдая за работой скриптов. Вариантов масса: Personal Web Server из поставки Win9x, Sambar, www.sambar.com, Apache-W32, www.apache.org
Устанавливаете сервер, и либо указываете в настройках сервера ассоциацию на файлы cgi и pl - запуск perl.exe, либо устанавливаете такую ассоциацию на эти файлы в windows (dbl click в windows explorer AKA проводник).

Как заставить работать связку perl + MySQL под виндой?

Скачать дистрибутив MySQL вместе с perl, который уже собран с необходимыми модулями - DBI и DBD:MySQL.

Regular expressions (регулярные выражения)


А что это за закорючки такие в скрипте - s/^[^\w]{1,3}(\d+)/$1/

Это регулярные выражения, одна из мощнейших возможностей perl. Средства поиска и замены подстрок в строках

Как ими пользоваться?

Этому учатся всю жизнь. Даже целая книга есть - ``Mastering regular expressions''. Также следует прочесть perldoc perlre А начать можно со следующего:
// - поиск         s/// - поиск и замена         tr/// - трансляция 
Если мы хотим узнать, нет ли в строке $_ подстроки 'my', мы пишем:
/my/; 
Если мы имеем дело не с переменной по умолчанию, а с любой другой, пишем:
$str=~/my/; 
Если мы хотим заменить в строке подстроку tree на root, используем поиск и замену:
$str=~s/tree/root/; 
В конце выражения могут стоять опции gi и т.п. g означает проводить замену не 1 раз, а по всей подстроке. i означает не учитывать регистр символов.
В подстроке для поиска можно использовать управляющие символы. Есть несколько видов управляющих символов - мета-символы, обозначающие какой-то символ из набора букв, цифр, и т.п., мета-символы, управляющие количеством символов, и т.п. Hапример, \d в подстроке обозначает любую цифру, \w - любую букву, \s - пробел, . - любой символ. Стоящая после мета-символа * означает, что предыдущий символ может повторяться 0 или более раз. + означает повторение 1 или более раз. То есть, строка вида
$str=~s/\s\d+\s/\s1\s/g; 
означает ``заменить все числа в строке $str, отделенные пробелами с двух сторон, на цифру 1, отделенную пробелами''.
Более подробное описание регулярных выражений, список управляющих символов и других возможностей смотрите в документации.

Как не учитывать регистр в русском тексте? С английским регекспы с ключом <CODE>i</CODE> работают, а с русским - нет.

Hа UNIX'оподобных системах с корректной локализацией (FreeBSD, Linux на glibc 2.1) это делается так:
use locale;     use POSIX qw (locale_h);     setlocale(LC_CTYPE, 'ru_RU.KOI8-R'); 
(можно еще выставить переменную окружения export LANG=ru_RU.KOI8-R; тогда будет достаточно вызова use locale; в Perl-скрипте)
Под Windows это делается так:
use locale;     use POSIX qw (locale_h);     setlocale(LC_CTYPE, "Russian_Russia.1251"); # или "Russian_Russia.866" 
С трансляцией АКА tr/XX/xx/ даже не используя use locale; можно так сделать:
tr/\xB3\xE0-\xFF/\xA3\xC0-\xDF/;            # для KOI8-r 
или
tr/\xA8\xC0-\xDF/\xB8\xE0-\xFF/;            # для Windows-1251 
или
tr/\xF0\x80-\x9F/\xF1\xA0-\xAF\xE0-\xEF/;   # для CP-866 

Data Bases


Как работать из perl с базами данных?

DBI. Это унифицированный программный интерфейс, придуманный для того, чтобы с разными базами можно было работать одинаково (за исключением, конечно, специфики самих SQL-запросов). Устанавливаете модуль DBI (Data Base Interface), ищете и устанавливаете DBD::something (Data Base Driver) - драйвер-связку между DBI и нужной вам базой. Oracle, MySQL, PostgreSQL и куча других СУБД поддерживаются DBI+DBD. Читаете perldoc DBI

Функции


Хочу прочитать список файлов в каталоге, но почему-то не работает или глючит. Делаю так: <CODE>@files=&amp;lt;*&amp;gt;</CODE>;

Такой способ вызывает внешнюю программу glob (также, как и способ @files=glob("*")). Это неправильно не только потому, что на запуск внешней программы уходит время и ресурсы, но и потому, что где-нибудь этой программы может просто не оказаться. Более правильный способ - это:
opendir DIR,'/tmp';         @files=readdir DIR;         closedir DIR; 
или
opendir DIR,'/tmp';         while $file (readdir DIR) {         }         closedir DIR; 
Заметьте, что в $file будут подставляться как имена файлов, так и имена подкаталогов. Hесколько подсказок. Чтобы прочесть список файлов, в котором не содержалось бы '.' и '..', можно написать следующее:
opendir DIR,'/tmp';         @files=grep !/^\.+$/,readdir DIR;         closedir DIR; 
Таким же способом, - с помощью regexp, - можно задавать любые другие маски файлов.
Если вы хотите прочесть список каталогов, не трогая файлы:
opendir DIR,/tmp';         @dirs=grep {!/^\.+$/ and -d "/tmp/$_"} readdir DIR;         closedir DIR; 

UNIX-специфика


Как сделать демона?

perldoc perlipc

E-mail


Можно ли проверить, жив ли определенный e-mail адрес?

В общем случае - нельзя. Проверка существования и функционирования домена, в котором этот email прописан, в сущности ничего не дает. Остается отталкиваться от конкретных требований. Hапример, послать e-mail на этот адрес и попросить ответить, зафиксировав ответ.

Разное


Как округлить число?

sprintf("%3.2f",$dig) 
Здесь 3 - кол-во знаков до запятой, 2 - после запятой.

Функция time() возвращает время с точностью до секунды. Как работать с меньшими промежутками?

perldoc Time::HiRes 

Как послать по e-mail письмо с аттачем?

perldoc Mime::Lite 

Как по дате вычислить день недели?

perldoc Date::Calc 

Как, зная дату и время, получить количество секунд, прошедших до этого времени с 1970 года (unix-time format)?

perldoc Time::Local 

Можно ли сделать GUI-интерфейс в перловой программе, или вывод в GUI-окно ее результатов?

модуль Tk. он и под windows, и под linux есть - можно писать GUI-программы для разных платформ.

Как устроить загрузку файла с удаленного сервера? Проще говоря, скачать скриптом файл с http или ftp

perldoc LWP 

Как передать из одного скрипта данные другому скрипту методом GET, вроде бы понятно. А как передавать данные методом POST?

Внимательно почитать документацию о LWP::UserAgent и HTTP::Request

Как создавать графические файлы на лету?

модуль GD, или внешние программы: Imagemagick, fly,..

WWW-специфика


Я положил скрипт на сервер, ввожу его путь в браузер, но вместо того, чтобы выполнять скрипт, браузер выводит его исходный текст.

Чтобы сервер запускал скрипт и выдавал результаты его работы, необходимо объяснить серверу, что этот файл - исполняемый. Существующее в unix-системах понятие ``атрибуты файла'' отличается от атрибутов в DOS/Windows, и в unix исполняемый файл определяется не расширением, а атрибутом. Если сервер работает на unix-системе, необходимо проставить на файл атрибуты исполняемого файла. Это делает команда ``chmod 0755 file'', если вы работаете через telnet или ssh, или же продвинутый FTP-клиент типа CuteFTP или FAR ftp plugin. Атрибуты файла, который могут исполнять все желающие (в том числе и сервер), выглядят в буквенном представлении, как -rwxr-xr-x

При попытке запустить скрипт происходит Internal Server Error! Что это за ошибка?

Это, строго говоря, просто сообщение об одной из ошибок, приведших к невозможности нормального выполнения скрипта. Чаще всего возникает в следующих случаях:
  1. в первой строке нет или неправильно указан путь к perl. обычно это #!/usr/local/bin/perl или #!/usr/bin/perl
  2. Файл со скриптом содержит DOS-овые концы строк 0x0D 0x0A. В юниксе конец строки - только 0x0A. Чтобы исправить это, воспользуйтесь соотв. возможностью редактора FAR (shift-f2, as Unix text), или при закачке скрипта на ftp используйте ASCII-режим вместо бинарного.
  3. Скрипт не выводит ничего во время работы, или не выводит заголовок. Hеобходимо, чтобы он выводил хотя бы content-type заголовок, например:
    print "Content-type: text/plain\n\n";         print "All done"; 
    Обратите внимание на двойной перевод строки в конце заголовка.
Если у вас нет доступа к логу ошибок сервера, для отладки скрипта используйте директиву
use CGI::Carp qw (fatalsToBrowser); 
В этом случае при фатальной ошибке, приводящей к завершению скрипта, эта ошибка будет видна вам в браузере.

Как узнать IP человека, вызвавшего скрипт?

$ENV{'REMOTE_ADDR'} 

Как узнать, с какой страницы идет ссылка на скрипт?

$ENV{'HTTP_REFERER'} 

Как узнать IP прокси, если через нее запустили скрипт?

$ENV{'HTTP_VIA'} 
Hекоторые прокси добавляют в конец заголовка строку типа ``, via ProxyName'', и в результате вместо переменной $ENV{'HTTP_VIA'} эту строку можно наблюдать в конце переменной $ENV{'HTTP_USER_AGENT'}.

А можно ли узнать IP юзера, запустившего скрипт через прокси?

$ENV{'HTTP_X_FORWARDED_FOR'} 
Hо не все прокси обеспечивают IP сидящего за ними юзера. ``Честные'' прокси - у провайдеров, например, - это делают. А некоторые халявные прокси-сервера могут и не показывать IP сидящего ``за'' ними пользователя. Кроме того, нередко этим отличаются корпоративные прокси-сервера, которые анонимизируют своих пользователей из соображений сетевой безопасности. Впрочем, ``настоящий'' IP адрес такого пользователя обычно еще и ``ненастоящий'', то есть недопустимый к использованию в Интернет (см. RFC 1597).

А какие еще значения есть у этой %ENV ?

for (keys %ENV) { print "$_ = ${ENV{$_}}\n" } 
То же самое, но по-другому записанное (более ``перловое'' решение):
print join("<br>",map("$_ = $ENV{$_}", keys %ENV)); 

Как запускать скрипт на сервере через определенные промежутки времени, или в определенное время суток, день недели, месяц?..

Это возможно, если есть шелл-доступ на сервер. Читайте man crontab

Как, зная ip, получить имя (DNS), за которым этот ip закреплен?

Встроенная функция gethostbyaddr()

Что такое method GET, и что такое method POST?

У меня секретов нет - слушайте, детишки. GET - передача параметров скрипту из строки location браузера. Пример: script.cgi?mode=aa&type=bb&length=12 Минусы этого метода:
  1. Все параметры видны в строке. Если в кач-ве параметров передается пароль - получается дырка в безопасности
  2. Длина данных, передаваемых таким методом, ограничена.
  3. Hельзя передавать multipart form data, в т.ч. файлы через кнопочку ``Browse''
POST - передача данных скрипту через STDIN. Отсутствуют минусы метода GET. Обычно метод GET используется, когда скрипт вызывается со страницы через линк <a href=...></a>, а POST - при нажатии кнопки submit в форме. О получении параметров внутри скрипта читайте в ответе на следующий вопрос.
Примечание. На самом деле все, конечно совершенно по-другому. RTFM: RFC 2616.

Как обрабатывать параметры, переданные скрипту?

Используйте модуль CGI. Прочтите perldoc CGI , а для начала вот простой пример:
use CGI;         $q=new CGI();         $mode=$q->param('mode'); 
$q - объект, который имеет несколько методов и полей, относящихся к параметрам вызова, переменным окружения, cookie, и пр. Смотритеperldoc CGI.
В $mode содержится значение параметра 'mode'.
или проще:
use CGI qw/:standard/;         $mode=param('mode'); 
если вам не нужно несколько объектов.

Посоветуйте халявный хостинг с поддержкой CGI на perl

www.virtualave.net         free.prohosting.com         www.hypermart.net 

Что надо указать в заголовках HTTP-ответа CGI скрипта, выводящего содержимое, которое надо не показать на экране, а сохранить в файле с заданным именем, например 'data.zip' ? А то браузер сохраняет файл с именем скрипта.

Content-Disposition: attachment; filename="filename.ext" 

Apache-специфика


А как бы мне сделать, чтобы вывод моего скрипта обрабатывался SSI?

Честно - никак. Почему - см. документацию на Apache. Однако, раз уж у нас есть Perl, нам, видимо (честно говоря, сам не пробовал), поможет CGI::SSI (если это CGI) или Apache::SSI (если mod_perl).

А как бы мне ограничить доступ к скрипту или директории только для умных и местных (способных взломать веб-сервер или знающих пароль)?

В принципе, возможно множество различных решений. Стандартное делается средствами авторизационного механизма веб-сервера. Читайте документацию Apache на предмет директив Auth* и require, а также на предмет параметра AuthConfig директивыAllowOverride, а то будете потом удивляться, почему совершенно правильный .htaccess не работает. mod_perl позволяет вклиниться в фазы контроля доступа, аутентификации и авторизации, и написать свои обработчики. Для аутентификации и авторизации по базам данных существуют модули для mod_perl AuthenDBI и AuthzDBI (в свежих версиях они объединились в один модуль, Apache::AuthDBI), а простейший пример файловой авторизации:
<Files "myscipt.cgi">         AuthType Basic         AuthName My.Script.Very.Secure         AuthFile /home/vasia/.htpasswd         require valid-user         </Files> 
Файл /home/vasia/.htpasswd может лежать (и это рекомендуется) в месте, недоступном для укачивания. Если положить его в такое место невозможно, надо защитить его от укачивания посредством
<Files ".htpasswd">         deny from all         </Files> 
или как минимум всё тем же паролем, только уже с require vasia. Его формат - имя:пароль, пароль зашифрован стандартным юниксовымcrypt(), так что если нет доступа к команде htpasswd (например, нет шелла), то можно сгенерировать его перловым скриптом. Я, собственно, поначалу так и делал, пока не сообразил, что должна быть специальная программа...
Ко всему этому рекомендуется помнить, что пароли Basic авторизации передаются по сети в незащищённом виде (base64-кодирование строки ``имя:пароль''), а поля форм &lt;input type=password&gt; показываются звёздочками только в браузере, по сети же передаются как есть (вернее, опять же закодированными, но уже как URL). Поэтому, если вы не пользуетесь защищённым каналом (SSL), работать так с действительно конфиденциальными данными нельзя.

mod_perl


Что такое mod_perl и зачем он нужен?

Hа пальцах - модуль к серверу Apache, который предназначен в первую очередь для ускорения запуска скриптов. Вместо того, чтобы каждый раз при запуске скрипта запускался perl, компилировал скрипт и выполнял его, этот perl все время запущен, и висит в памяти. В памяти же находятся и уже откомпилированные до состояния исполняемого кода скрипты. Кроме этого он позволяет вмешиваться почти во все стадии работы сервера, от конфигурирования до различных стадий обработки запроса; он избавляет от накладных расходов на запуск Perl и компиляцию вашего скрипта при каждом обращении к нему; он позволяет получать от Апача все данные о нём самом и о запросе, которые у того есть.

Что означает ругань "<CODE>Value of $x will not stay shared at - line 5</CODE>" и "<CODE>Constant subroutine XXX redefined ...</CODE>" при попытке запустить скрипт при помощи mod_perl?

Это следствие различий между работой честного CGI-скрипта, когда для выполнения скрипта порождается новый процесс, а по завершении скрипта процесс завершается, и работой под управлением Apache::Registry - модуля эмуляции окружения CGI под mod_perl. Скрипт, исполняющийся под Apache::Registry, выполняется как функция в том же процессе, что и сам веб-сервер, и результат его компиляции кэшируется mod_perl'ом до обновления скрипта. Второе сообщение не страшно - оно всего лишь предупреждает, что определённая в скрипте функция была перекомпилирована при повторном выполнении (или при перекомпиляции? не помню) скрипта. А вот первое чревато неприятностями, и означает оно, что определённая в скрипте (теперь - функции где-то внутри Apache::Registry) функция пользуется определённой в нём же лексической (my) переменной, не получая её среди аргументов. Такая функция называется closure (вернее, closure называется такая же, но анонимная функция), и смысл её в том, что значение этой переменной на момент определения функции сохраняется в ней, и в дальнейшем при обращении к ней она будет пользоваться этим сохранённым значением (в нашем случае - тем, которое приняла переменная при первом запросе к данному скрипту в данном экземпляре Апача), а не новым. Лечится это двумя различными способами: если этот скрипт уже более-менее отлажен и используется часто, полезно перенести определения функций из него в отдельный модуль; если же он пока отлаживается, то см. следующий вопрос.

Hаписание скриптов под mod_perl чем нибудь отличается от написания обычных CGI скриптов?

Вообще говоря, да.
Во-первых, существует куча более других способов писания под mod_perl - Perl-SSI, Perl*Handlers, логика работы которых сильно отличается от CGI. Если же мы говорим о тех скриптах, которые выполняются через Apache::Registry, то есть следующие различия:
  1. Hельзя использовать my-переменные уровня файла. То есть использовать можно, но результат будет ну очень странный. Дело в том, что с точки зрения перла, mod_perl-овый скрипт это не файл, а тело процедуры. Поэтому использование в нем my переменных, которые потом пользуются из вложенных процедур, приводит к возникновению closure и всему, что из этого следует.
    Я лично исполюзую следующую технику:
    use CGI;         use DBI;         use strict;         use что-там-еще-надо 
    &main; 
    sub main {         my $cgi=new CGI; 
    .... 
    } 
    sub some_more_sub {         ...         } 
    При таким образом написанном скрипте я уверен что lexical scoring будет вести себя одинаково и в CGI и в mod_perl.
  2. Скрипты живут долго. Поэтому мусор за собой надо чистить аккуратно.
  3. Тебе доступен объект Apache::Request, который содержит уйму интересной информации; в частности, из него можно вытащить пароль при basic authentication.
  4. Теоретически, у тебя есть куда больше способов повлиять на поведение Apache в процессе обработки твоего запроса, чем из CGI.
  5. Если ты используешь самописные модули, то при их редактировании придется апач перестартовывать (apachectl graceful) - поскольку крайне сложно (и долго) проверять все зависимости, Apache::Registry проверяет только момент изменения самого исполняемого им скрипта, а модули, используемые в качестве Perl*Handler, не проверяются вообще. Если в конфигурации Апача сказано PerlFreshRestart On, то достаточно его об этом попросить вежливо (SIGUSR1 AKA apachectl graceful или SIGHUP AKA apachectl restart), но за отработкой этой директивы при наличии сложных модулей замечены проблемы. Если она Off, то придётся положить и поднять (apachectl stop; apachectl start). Существует модуль Apache:StatINC, который следит за изменениями модулей и перегружает их по мере изменения. Hо есть подозрение, что он не надёжнее PerlFresRestart.
    При изменении модулей остерегайтесь эффекта частичного срабатывания - некоторые запросы обрабатываются еще старой версией модуля, а некоторые - уже новой. Это происходит оттого, что модуль грузится отдельно каждым экземпляром Apache, скорее всего, только при первом обращении к использующему его скрипту, а потому часть экземпляров ``запомнила'' старый, а к остальным попал уже ``новый''.

Примеры скриптов и функций


Как одновременно поставить куку и сделать редирект?

sub ReLocate         {                 my($where,$cookie)=@_;                 print "Status: 302 Moved\n";                 if ($cookie ne '') { print "Set-Cookie: $cookie\n" }                 print "Location: $where\n\n";         } 

Hадо записать в файл строку, а потом прочесть ее оттуда

# записать строку в файл         open FILE,'>file';   # открыть файл на запись         print FILE 'строка'; # записать строку         close FILE;          # закрыть файл 
# прочитать строку из файла         open FILE,'file'; # открыть файл на чтение         $string=<FILE>;   # прочесть одну строку, включая символ                           # "перевод строки"         chomp($string);   # обрезать в конце строки "перевод строки",                           # если он есть         close FILE;       # закрыть файл 

Закачка файлов на сервер и решение глюка с закачкой

#!/usr/bin/perl 
$SIG{ALRM} = sub { die "$0 timed out" }; # эти 2 строки не работают под         alarm 900;                               # Windows, но они необязательны 
use strict;                              # спасает от глупых ошибок         use Fcntl;                               # O_EXCL, O_CREAT и O_WRONLY         use CGI       qw (:standard);            # читайте "perldoc CGI"         use CGI::Carp qw (fatalsToBrowser);      # вывод ошибок к browser-у  
$CGI::POST_MAX = 131072;                 # максимальный ввод = 128 KB 
my $foto = param ('foto');               # имя файла и одноврем. handle         my $DIR  = '/home/alex/pics';            # не забудьте "chmod 777 pics"         my $JS   = "                             // JavaScript-функция для пред-                                                  // варительной проверки формы         function check (form)         {         if (form.elements['foto'].value.length < 4)// foto должно быть заполнено         {                 alert ('A gde zhe foto?');        // показать JavaScript-окошко                 form.elements['foto'].select ();  // выделить текст в поле foto                 form.elements['foto'].focus ();   // и прыгнуть туда курсором 
return false;                     // false запретит browser-у         }                                         // отправлять данные к серверу 
return true;                              // все OK - можно отправлять         }"; 
print header (-type  => 'text/html; charset=koi8-r'),         start_html (-title  => 'МИСС ИHТЕРHЕТ',   # напечатать заголовок и $JS                         -script => $JS);                          # regex внизу проверяет, есть ли .gif или .jp(e)g в конце и кладет имя         # файла в $1 
if ($foto !~ /([\w-]+ \. (?: gif | jpe?g ))$/ix) # только имя,                                                          # путь выкидывается         {         print h1 ('Отправьте нам фото!'),          #start_form работать не будет                 start_multipart_form (-onsubmit => 'return check (this)'),                 filefield (-name => 'foto'),                 submit (-value => 'Go baby go!'),  # напечатать форму с кнопкой                 end_form;                          # напечатать </FORM>         } 
# Этот скрипт никому не мешает вводить мусор (например xxxx.gif)         # в поле foto, что приведет к созданию пустых файлов; если это Вас         # беспокоит, установите новую версию CGI.pm и прочтите         # http://stein.cshl.org/WWW/software/CGI/#upload 
elsif (not sysopen FILE, "$DIR/$1", O_EXCL | O_CREAT | O_WRONLY, 0444)         {         print h1 ("Hе могу создать $DIR/$1: $!"); # ошибка или такой файл уже есть         } 
# Портятся файлы при посылке? См. ниже! 
else                                           # все в порядке - файл создан         {         binmode FILE;                              # включить binmode для Windows         print FILE while (<$foto>);                # и скопировать данные в файл         close FILE; 
print h1 ('Сердечное Вам спасибо!');       # воспитывать как собак Павлова         } 
print end_html;                                # напечатать </BODY></HTML> 
Если закачка некоторых файлов происходит с глюками - видимо, файл перекодируется на лету русским апачем.
Варианты решения:
  1. запретите все перекодировки для скрипта, который разбирает FileUpload, например таким способом:
    <Location /path/to/upload.cgi>         CharsetDisable On         </Location> 
    и делайте перекодировку сами.
  2. Используйте директиву CharsetRecodeMultipartForms, которая появилась в PL23, но при этом вам все равно придется перекодировать вручную текстовые части запросов. Для этого можно использовать Russian Apache API, доступное в других модулях или Russian Apache Perl API, доступное из mod_perl.

No comments:

Post a Comment