Двоичные данные Python POST

Я пишу код для интерфейса с redmine, и мне нужно загрузить некоторые файлы в рамках процесса, но я не уверен, как сделать запрос POST от python, содержащий двоичный файл.

Я пытаюсь имитировать команды здесь:

curl --data-binary "@image.png" -H "Content-Type: application/octet-stream" -X POST -u login:password http://redmine/uploads.xml

в python (ниже), но это, похоже, не работает. Я не уверен, что проблема каким-то образом связана с кодированием файла или что-то не так с заголовками.

import urllib2, os

FilePath = "C:somefoldersomefile.7z"
FileData = open(FilePath, "rb")
length = os.path.getsize(FilePath)

password_manager = urllib2.HTTPPasswordMgrWithDefaultRealm()
password_manager.add_password(None, 'http://redmine/', 'admin', 'admin')
auth_handler = urllib2.HTTPBasicAuthHandler(password_manager)
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)
request = urllib2.Request( r'http://redmine/uploads.xml', FileData)
request.add_header('Content-Length', '%d' % length)
request.add_header('Content-Type', 'application/octet-stream')
try:
    response = urllib2.urlopen( request)
    print response.read()
except urllib2.HTTPError as e:
    error_message = e.read()
    print error_message

Я доступ к серверу и это выглядит как ошибка кодирования:

...
invalid byte sequence in UTF-8
Line: 1
Position: 624
Last 80 unconsumed characters:
7z¼¯'ÅÐз2^Ôøë4g¸R<süðí6kĤª¶!»=}jcdjSPúá-º#»ÄAtD»H7Ê!æ½]j):

(further down)

Started POST "/uploads.xml" for 192.168.0.117 at 2013-01-16 09:57:49 -0800
Processing by AttachmentsController#upload as XML
WARNING: Can't verify CSRF token authenticity
  Current user: anonymous
Filter chain halted as :authorize_global rendered or redirected
Completed 401 Unauthorized in 13ms (ActiveRecord: 3.1ms)

4 ответов


в основном то, что вы делаете правильно. Глядя на документы redmine, с которыми вы связаны, кажется, что суффикс после точки в url обозначает тип размещенных данных (.JSON для данных JSON, .xml для XML), который согласуется с ответом, который вы получаете -Processing by AttachmentsController#upload as XML. Я думаю, что есть ошибка в документах и двоичных данных, вы должны попробовать использовать http://redmine/uploads url вместо http://redmine/uploads.xml.

кстати, я настоятельно рекомендую очень хороший и очень популярный запросы библиотека для http в Python. Это намного лучше. чем то, что находится в стандартном lib (urllib2). Он также поддерживает аутентификацию, но я пропустил ее для краткости здесь.

import requests

data = open('./x.png', 'rb').read()
res = requests.post(url='http://httpbin.org/post',
                    data=data,
                    headers={'Content-Type': 'application/octet-stream'})

# let's check if what we sent is what we intended to send...
import json
import base64

assert base64.b64decode(res.json()['data'][len('data:application/octet-stream;base64,'):]) == data

обновление

чтобы узнать, почему это работает с запросами, но не с urllib2, мы должны изучить разницу в том, что отправляется. Чтобы увидеть это, я отправляю трафик на HTTP proxy (Fiddler), работающий на порту 8888:

Использование Запросов

import requests

data = 'test data'
res = requests.post(url='http://localhost:8888',
                    data=data,
                    headers={'Content-Type': 'application/octet-stream'})

мы видим

POST http://localhost:8888/ HTTP/1.1
Host: localhost:8888
Content-Length: 9
Content-Type: application/octet-stream
Accept-Encoding: gzip, deflate, compress
Accept: */*
User-Agent: python-requests/1.0.4 CPython/2.7.3 Windows/Vista

test data

и используя urllib2

import urllib2

data = 'test data'    
req = urllib2.Request('http://localhost:8888', data)
req.add_header('Content-Length', '%d' % len(data))
req.add_header('Content-Type', 'application/octet-stream')
res = urllib2.urlopen(req)

мы

POST http://localhost:8888/ HTTP/1.1
Accept-Encoding: identity
Content-Length: 9
Host: localhost:8888
Content-Type: application/octet-stream
Connection: close
User-Agent: Python-urllib/2.7

test data

Я не вижу никаких различий, которые оправдывали бы различное поведение, которое вы наблюдаете. Сказав, что это не редкость для http-серверов для проверки User-Agent заголовок и варьировать поведение в зависимости от его значения. Попробуйте изменить заголовки, отправленные запросами один за другим, делая их такими же, как те, которые отправляются urllib2, и посмотреть, когда он перестает работать.


Это не имеет ничего общего с искаженным загрузки. Ошибка HTTP четко указывает 401 несанкционированный и сообщает вам, что маркер CSRF недействителен. Попробуйте отправить действительный токен CSRF с загрузкой.

подробнее о токенах csrf здесь:

что такое токен CSRF ? Какова его важность и как он работает?


вам нужно добавить заголовок Content-Disposition, smth как это (хотя я использовал mod-python здесь, но принцип должен быть таким же):

request.headers_out['Content-Disposition'] = 'attachment; filename=%s' % myfname

можно использовать унирест, он обеспечивает простой метод для отправки запроса. `

import unirest

def callback(response):
 print "code:"+ str(response.code)
 print "******************"
 print "headers:"+ str(response.headers)
 print "******************"
 print "body:"+ str(response.body)
 print "******************"
 print "raw_body:"+ str(response.raw_body)

# consume async post request
def consumePOSTRequestASync():
 params = {'test1':'param1','test2':'param2'}

 # we need to pass a dummy variable which is open method
 # actually unirest does not provide variable to shift between
 # application-x-www-form-urlencoded and
 # multipart/form-data

 params['dummy'] = open('dummy.txt', 'r')
 url = 'http://httpbin.org/post'
 headers = {"Accept": "application/json"}
 # call get service with headers and params
 unirest.post(url, headers = headers,params = params, callback = callback)


# post async request multipart/form-data
consumePOSTRequestASync()

`

вы можете проверить полный пример вhttp://stackandqueue.com/?p=57