AmazonS3 putObject с примером длины InputStream
Я загружаю файл на S3 с помощью Java - это то, что я получил до сих пор:
AmazonS3 s3 = new AmazonS3Client(new BasicAWSCredentials("XX","YY"));
List<Bucket> buckets = s3.listBuckets();
s3.putObject(new PutObjectRequest(buckets.get(0).getName(), fileName, stream, new ObjectMetadata()));
Файл загружается, но ПРЕДУПРЕЖДЕНИЕ возникает, когда я не устанавливаю длину содержимого:
com.amazonaws.services.s3.AmazonS3Client putObject: No content length specified for stream > data. Stream contents will be buffered in memory and could result in out of memory errors.
Это файл, который я загружаю, а переменная stream
- это InputStream
, из которой я могу получить массив байтов следующим образом: IOUtils.toByteArray(stream)
.
Поэтому, когда я пытаюсь установить длину контента и MD5 (взятый из здесь), выполните следующие действия:
// get MD5 base64 hash
MessageDigest messageDigest = MessageDigest.getInstance("MD5");
messageDigest.reset();
messageDigest.update(IOUtils.toByteArray(stream));
byte[] resultByte = messageDigest.digest();
String hashtext = new String(Hex.encodeHex(resultByte));
ObjectMetadata meta = new ObjectMetadata();
meta.setContentLength(IOUtils.toByteArray(stream).length);
meta.setContentMD5(hashtext);
Это приводит к следующей ошибке, возвращаемой с S3:
Указанный вами контент-MD5 недействителен.
Что я делаю неправильно?
Любая помощь оценивается!
PS Я нахожусь в Google App Engine - я не могу записать файл на диск или создать временный файл, потому что AppEngine не поддерживает FileOutputStream.
Ответы
Ответ 1
Поскольку исходный вопрос никогда не отвечал, и мне пришлось столкнуться с этой же проблемой, решение проблемы с MD5 заключается в том, что S3 не хочет, чтобы мы обычно думали о кодировке MD5, кодированной Hex.
Вместо этого я должен был это сделать.
// content is a passed in InputStream
byte[] resultByte = DigestUtils.md5(content);
String streamMD5 = new String(Base64.encodeBase64(resultByte));
metaData.setContentMD5(streamMD5);
По сути, они хотят, чтобы значение MD5 было базируемым в Base64 исходным массивом байтов MD5, а не строкой Hex. Когда я переключился на это, он начал работать отлично для меня.
Ответ 2
Если все, что вы пытаетесь сделать, это разрешить ошибку длины контента из amazon, тогда вы можете просто прочитать байты из входного потока в Long и добавить это к метаданным.
/*
* Obtain the Content length of the Input stream for S3 header
*/
try {
InputStream is = event.getFile().getInputstream();
contentBytes = IOUtils.toByteArray(is);
} catch (IOException e) {
System.err.printf("Failed while reading bytes from %s", e.getMessage());
}
Long contentLength = Long.valueOf(contentBytes.length);
ObjectMetadata metadata = new ObjectMetadata();
metadata.setContentLength(contentLength);
/*
* Reobtain the tmp uploaded file as input stream
*/
InputStream inputStream = event.getFile().getInputstream();
/*
* Put the object in S3
*/
try {
s3client.putObject(new PutObjectRequest(bucketName, keyName, inputStream, metadata));
} catch (AmazonServiceException ase) {
System.out.println("Error Message: " + ase.getMessage());
System.out.println("HTTP Status Code: " + ase.getStatusCode());
System.out.println("AWS Error Code: " + ase.getErrorCode());
System.out.println("Error Type: " + ase.getErrorType());
System.out.println("Request ID: " + ase.getRequestId());
} catch (AmazonClientException ace) {
System.out.println("Error Message: " + ace.getMessage());
} finally {
if (inputStream != null) {
inputStream.close();
}
}
Вам нужно будет прочитать входной поток дважды, используя этот точный метод, поэтому, если вы загружаете очень большой файл, вам может потребоваться прочитать его один раз в массиве, а затем прочитать его оттуда.
Ответ 3
Для загрузки S3 SDK имеет два метода putObject:
PutObjectRequest(String bucketName, String key, File file)
и
PutObjectRequest(String bucketName, String key, InputStream input, ObjectMetadata metadata)
Метод inputstream + ObjectMetadata требует минимальных метаданных Content Length вашего входного потока. Если вы этого не сделаете, тогда он будет буферизовать в памяти, чтобы получить эту информацию, это может вызвать OOM. Кроме того, вы можете сделать свою собственную буферизацию в памяти, чтобы получить длину, но тогда вам нужно получить второй входной поток.
Не задано ОП (ограничения его окружения), но для кого-то другого, такого как я. Мне становится проще и безопаснее (если у вас есть доступ к временному файлу), чтобы написать входной поток во временный файл и поместить временный файл. Нет буфера в памяти и нет необходимости создавать второй входной поток.
AmazonS3 s3Service = new AmazonS3Client(awsCredentials);
File scratchFile = File.createTempFile("prefix", "suffix");
try {
FileUtils.copyInputStreamToFile(inputStream, scratchFile);
PutObjectRequest putObjectRequest = new PutObjectRequest(bucketName, id, scratchFile);
PutObjectResult putObjectResult = s3Service.putObject(putObjectRequest);
} finally {
if(scratchFile.exists()) {
scratchFile.delete();
}
}
Ответ 4
При записи на S3 вам нужно указать длину объекта S3, чтобы убедиться, что ошибок в памяти нет.
Использование IOUtils.toByteArray(stream)
также подвержено ошибкам OOM, потому что это поддерживается ByteArrayOutputStream
Итак, лучший вариант - сначала записать входной поток в временный файл на локальном диске, а затем использовать этот файл для записи на S3, указав длину временного файла.
Ответ 5
Я фактически делаю то же самое, но на своем хранилище AWS S3: -
Код для сервлета, который получает загруженный файл: -
import java.io.IOException;
import java.io.PrintWriter;
import java.util.List;
import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import org.apache.commons.fileupload.FileItem;
import org.apache.commons.fileupload.disk.DiskFileItemFactory;
import org.apache.commons.fileupload.servlet.ServletFileUpload;
import com.src.code.s3.S3FileUploader;
public class FileUploadHandler extends HttpServlet {
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
doPost(request, response);
}
protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
PrintWriter out = response.getWriter();
try{
List<FileItem> multipartfiledata = new ServletFileUpload(new DiskFileItemFactory()).parseRequest(request);
//upload to S3
S3FileUploader s3 = new S3FileUploader();
String result = s3.fileUploader(multipartfiledata);
out.print(result);
} catch(Exception e){
System.out.println(e.getMessage());
}
}
}
Код, который загружает эти данные как объект AWS: -
import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.util.List;
import java.util.UUID;
import org.apache.commons.fileupload.FileItem;
import com.amazonaws.AmazonClientException;
import com.amazonaws.AmazonServiceException;
import com.amazonaws.auth.ClasspathPropertiesFileCredentialsProvider;
import com.amazonaws.services.s3.AmazonS3;
import com.amazonaws.services.s3.AmazonS3Client;
import com.amazonaws.services.s3.model.ObjectMetadata;
import com.amazonaws.services.s3.model.PutObjectRequest;
import com.amazonaws.services.s3.model.S3Object;
public class S3FileUploader {
private static String bucketName = "***NAME OF YOUR BUCKET***";
private static String keyName = "Object-"+UUID.randomUUID();
public String fileUploader(List<FileItem> fileData) throws IOException {
AmazonS3 s3 = new AmazonS3Client(new ClasspathPropertiesFileCredentialsProvider());
String result = "Upload unsuccessfull because ";
try {
S3Object s3Object = new S3Object();
ObjectMetadata omd = new ObjectMetadata();
omd.setContentType(fileData.get(0).getContentType());
omd.setContentLength(fileData.get(0).getSize());
omd.setHeader("filename", fileData.get(0).getName());
ByteArrayInputStream bis = new ByteArrayInputStream(fileData.get(0).get());
s3Object.setObjectContent(bis);
s3.putObject(new PutObjectRequest(bucketName, keyName, bis, omd));
s3Object.close();
result = "Uploaded Successfully.";
} catch (AmazonServiceException ase) {
System.out.println("Caught an AmazonServiceException, which means your request made it to Amazon S3, but was "
+ "rejected with an error response for some reason.");
System.out.println("Error Message: " + ase.getMessage());
System.out.println("HTTP Status Code: " + ase.getStatusCode());
System.out.println("AWS Error Code: " + ase.getErrorCode());
System.out.println("Error Type: " + ase.getErrorType());
System.out.println("Request ID: " + ase.getRequestId());
result = result + ase.getMessage();
} catch (AmazonClientException ace) {
System.out.println("Caught an AmazonClientException, which means the client encountered an internal error while "
+ "trying to communicate with S3, such as not being able to access the network.");
result = result + ace.getMessage();
}catch (Exception e) {
result = result + e.getMessage();
}
return result;
}
}
Примечание. - Я использую файл свойств aws для учетных данных.
Надеюсь, что это поможет.
Ответ 6
Я создал библиотеку, которая использует многостраничные загрузки в фоновом режиме, чтобы избежать буферизации всего в памяти и также не записывать на диск: https://github.com/alexmojaki/s3-stream-upload
Ответ 7
Добавление файла log4j-1.2.12.jar разрешило проблему для меня