Двоичные данные Python POST
Я пишу код для интерфейса с redmine, и мне нужно загрузить некоторые файлы в рамках процесса, но я не уверен, как сделать запрос POST от python, содержащий двоичный файл.
Я пытаюсь имитировать команды здесь:
curl --data-binary "@image.png" -H "Content-Type: application/octet-stream" -X POST -u login:password http://redmine/uploads.xml
в python (ниже), но это, похоже, не работает. Я не уверен, что проблема каким-то образом связана с кодированием файла или что-то не так с заголовками.
import urllib2, os
FilePath = "C:somefoldersomefile.7z"
FileData = open(FilePath, "rb")
length = os.path.getsize(FilePath)
password_manager = urllib2.HTTPPasswordMgrWithDefaultRealm()
password_manager.add_password(None, 'http://redmine/', 'admin', 'admin')
auth_handler = urllib2.HTTPBasicAuthHandler(password_manager)
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)
request = urllib2.Request( r'http://redmine/uploads.xml', FileData)
request.add_header('Content-Length', '%d' % length)
request.add_header('Content-Type', 'application/octet-stream')
try:
response = urllib2.urlopen( request)
print response.read()
except urllib2.HTTPError as e:
error_message = e.read()
print error_message
Я доступ к серверу и это выглядит как ошибка кодирования:
...
invalid byte sequence in UTF-8
Line: 1
Position: 624
Last 80 unconsumed characters:
7z¼¯'ÅÐз2^Ôøë4g¸R<süðí6kĤª¶!»=}jcdjSPúá-º#»ÄAtD»H7Ê!æ½]j):
(further down)
Started POST "/uploads.xml" for 192.168.0.117 at 2013-01-16 09:57:49 -0800
Processing by AttachmentsController#upload as XML
WARNING: Can't verify CSRF token authenticity
Current user: anonymous
Filter chain halted as :authorize_global rendered or redirected
Completed 401 Unauthorized in 13ms (ActiveRecord: 3.1ms)
4 ответов
в основном то, что вы делаете правильно. Глядя на документы redmine, с которыми вы связаны, кажется, что суффикс после точки в url обозначает тип размещенных данных (.JSON для данных JSON, .xml для XML), который согласуется с ответом, который вы получаете -Processing by AttachmentsController#upload as XML
. Я думаю, что есть ошибка в документах и двоичных данных, вы должны попробовать использовать http://redmine/uploads
url вместо http://redmine/uploads.xml
.
кстати, я настоятельно рекомендую очень хороший и очень популярный запросы библиотека для http в Python. Это намного лучше. чем то, что находится в стандартном lib (urllib2). Он также поддерживает аутентификацию, но я пропустил ее для краткости здесь.
import requests
data = open('./x.png', 'rb').read()
res = requests.post(url='http://httpbin.org/post',
data=data,
headers={'Content-Type': 'application/octet-stream'})
# let's check if what we sent is what we intended to send...
import json
import base64
assert base64.b64decode(res.json()['data'][len('data:application/octet-stream;base64,'):]) == data
обновление
чтобы узнать, почему это работает с запросами, но не с urllib2, мы должны изучить разницу в том, что отправляется. Чтобы увидеть это, я отправляю трафик на HTTP proxy (Fiddler), работающий на порту 8888:
Использование Запросов
import requests
data = 'test data'
res = requests.post(url='http://localhost:8888',
data=data,
headers={'Content-Type': 'application/octet-stream'})
мы видим
POST http://localhost:8888/ HTTP/1.1
Host: localhost:8888
Content-Length: 9
Content-Type: application/octet-stream
Accept-Encoding: gzip, deflate, compress
Accept: */*
User-Agent: python-requests/1.0.4 CPython/2.7.3 Windows/Vista
test data
и используя urllib2
import urllib2
data = 'test data'
req = urllib2.Request('http://localhost:8888', data)
req.add_header('Content-Length', '%d' % len(data))
req.add_header('Content-Type', 'application/octet-stream')
res = urllib2.urlopen(req)
мы
POST http://localhost:8888/ HTTP/1.1
Accept-Encoding: identity
Content-Length: 9
Host: localhost:8888
Content-Type: application/octet-stream
Connection: close
User-Agent: Python-urllib/2.7
test data
Я не вижу никаких различий, которые оправдывали бы различное поведение, которое вы наблюдаете. Сказав, что это не редкость для http-серверов для проверки User-Agent
заголовок и варьировать поведение в зависимости от его значения. Попробуйте изменить заголовки, отправленные запросами один за другим, делая их такими же, как те, которые отправляются urllib2, и посмотреть, когда он перестает работать.
Это не имеет ничего общего с искаженным загрузки. Ошибка HTTP четко указывает 401 несанкционированный и сообщает вам, что маркер CSRF недействителен. Попробуйте отправить действительный токен CSRF с загрузкой.
подробнее о токенах csrf здесь:
что такое токен CSRF ? Какова его важность и как он работает?
вам нужно добавить заголовок Content-Disposition, smth как это (хотя я использовал mod-python здесь, но принцип должен быть таким же):
request.headers_out['Content-Disposition'] = 'attachment; filename=%s' % myfname
можно использовать унирест, он обеспечивает простой метод для отправки запроса. `
import unirest
def callback(response):
print "code:"+ str(response.code)
print "******************"
print "headers:"+ str(response.headers)
print "******************"
print "body:"+ str(response.body)
print "******************"
print "raw_body:"+ str(response.raw_body)
# consume async post request
def consumePOSTRequestASync():
params = {'test1':'param1','test2':'param2'}
# we need to pass a dummy variable which is open method
# actually unirest does not provide variable to shift between
# application-x-www-form-urlencoded and
# multipart/form-data
params['dummy'] = open('dummy.txt', 'r')
url = 'http://httpbin.org/post'
headers = {"Accept": "application/json"}
# call get service with headers and params
unirest.post(url, headers = headers,params = params, callback = callback)
# post async request multipart/form-data
consumePOSTRequestASync()
`
вы можете проверить полный пример вhttp://stackandqueue.com/?p=57