Как реализовать поддержку cookie в ruby net / http?

Я хотел бы добавить поддержку cookie в класс ruby, использующий net / http для просмотра веб-страниц. Cookies должны храниться в файле, чтобы выжить после завершения сценария. Конечно, я могу прочитать спецификации и написать какой-то обработчик, использовать некоторые cookie.формат txt и так далее, но это, похоже,означает изобретение колеса. Есть ли лучший способ выполнить эту задачу? Может быть, какой-то класс cooie jar, чтобы заботиться о печенье?

6 ответов


принято от DZone Фрагменты

http = Net::HTTP.new('profil.wp.pl', 443)
http.use_ssl = true
path = '/login.html'

# GET request -> so the host can set his cookies
resp, data = http.get(path, nil)
cookie = resp.response['set-cookie'].split('; ')[0]


# POST request -> logging in
data = 'serwis=wp.pl&url=profil.html&tryLogin=1&countTest=1&logowaniessl=1&login_username=blah&login_password=blah'
headers = {
  'Cookie' => cookie,
  'Referer' => 'http://profil.wp.pl/login.html',
  'Content-Type' => 'application/x-www-form-urlencoded'
}

resp, data = http.post(path, data, headers)


# Output on the screen -> we should get either a 302 redirect (after a successful login) or an error page
puts 'Code = ' + resp.code
puts 'Message = ' + resp.message
resp.each {|key, val| puts key + ' = ' + val}
puts data

обновление

#To save the cookies, you can use PStore
cookies = PStore.new("cookies.pstore")

# Save the cookie  
cookies.transaction do
  cookies[:some_identifier] = cookie
end

# Retrieve the cookie back
cookies.transaction do
  cookie = cookies[:some_identifier] 
end

принятый ответ не будет работать, если ваш сервер возвращает и ожидает несколько файлов cookie. Это может произойти, например, если сервер возвращает набор файлов cookie FedAuth[n]. Если это влияет на вас, вы можете использовать что-то вроде следующего:

http = Net::HTTP.new('https://example.com', 443)
http.use_ssl = true
path1 = '/index.html'
path2 = '/index2.html'

# make a request to get the server's cookies
response = http.get(path)
if (response.code == '200')
    all_cookies = response.get_fields('set-cookie')
    cookies_array = Array.new
    all_cookies.each { | cookie |
        cookies_array.push(cookie.split('; ')[0])
    }
    cookies = cookies_array.join('; ')

    # now make a request using the cookies
    response = http.get(path2, { 'Cookie' => cookies })
end

принятый ответ не работает. Вам нужно получить доступ к внутреннему представлению заголовка ответа, где несколько значений set-cookie хранятся отдельно, а затем удалить все после первой точки с запятой из этой строки и объединить их вместе. Вот код, который работает

r = http.get(path)
cookie = {'Cookie'=>r.to_hash['set-cookie'].collect{|ea|ea[/^.*?;/]}.join}
r = http.get(next_path,cookie)

использовать http-cookie, который реализует RFC-совместимый синтаксический анализ и рендеринг, а также банку.

грубый пример, который происходит после перенаправления после входа в систему:

require 'uri'
require 'net/http'
require 'http-cookie'

uri = URI('...')
jar = HTTP::CookieJar.new

Net::HTTP.start(uri.host, uri.port, use_ssl: uri.scheme == 'https') do |http|
  req = Net::HTTP::Post.new uri
  req.form_data = { ... }
  res = http.request req
  res.get_fields('Set-Cookie').each do |value|
    jar.parse(value, req.uri)
  end

  fail unless res.code == '302'

  req = Net::HTTP::Get.new(uri + res['Location'])
  req['Cookie'] = HTTP::Cookie.cookie_value(jar.cookies(uri))
  res = http.request req
end

почему это? Поскольку ответы выше невероятно недостаточны и не работают во многих сценариях, совместимых с RFC (случилось со мной), поэтому полагаться на саму реализацию lib только то, что нужно, бесконечно более надежно, если вы хотите обрабатывать более одного конкретного случай.


Я использовал Curb и Mechanize для аналогичного проекта. Просто включите поддержку cookies и сохраните cookies в temp cookiejar... Если вы используете net / http или пакеты без встроенной поддержки cookie, вам нужно будет написать свою собственную обработку файлов cookie.


вы можете отправить получать cookies с помощью заголовков.

вы можете сохранить заголовок в любой структуре персистентности. Будь то какая-то база данных или файлы.