Python 设置S3文件属性中元数据的Content-Encoding值

codeAB

2019-10-23

背景: 使用脚本从S3下载下来的CSV文件打开发现是乱码,但是在网页上面点击下载按钮下载后却能正常打开.

研究发现,在S3文件属性的元数据中有Content-Encoding值是gzip

浏览器下载的时候会识别这个值,然后在帮你自动减压后下载. 但是利用官方boto3包的download_fileobj()方法中,却无法指定对应的参数(不知道以后不会优化).

下载的话就比较简单了,下载后直接利用gzip解压后再处理数据即可.

import boto3
import gzip
import csv


s3 = boto3.client('s3')
bucket = 'my_bucket'
download_key = 'my.csv'
file_path = '/tmp/my.csv'

with open('/tmp/my.csv.gz', 'wb') as file_date:
    s3.download_fileobj(bucket, download_key, file_date)
g = gzip.GzipFile(mode="rb", fileobj=open('/tmp/my.csv.gz', 'rb'))
open(file_path, "wb").write(g.read())
csv_file_open = open(file_path, 'r')
csv_file = csv.reader(csv_file_open)

上传的我研究了好久.因为我发现upload_file()方法中也无法提供Content-Encoding参数,虽然我找到了ExtraArgs参数中可以添加Metadata的字段,然后发现这个是个自定义元数据用的.会自动转换成x-amz-meta-content-encoding.这就很扯淡了.

s3_resource.meta.client.upload_file(file_path, bucket, key, ExtraArgs={'Metadata': {'Content-Encoding': 'gzip'}})

进一步研究发现在copy_object()方法中ContentEncoding 参数才是真正用来设置S3文件属性的元数据中的Content-Encoding值.

所以有一种方法是先用uploadfile上传数据,然后在用copy_object()拷贝后修改Content-Encoding属性.(这样比较蛋疼)

最后发现put_object()方法也带有这个参数,这样的话我们可以利用put_object方法来操作.代码片段如下.自己先压缩好gzip文件.

f = open('/tmp/my_gz.csv', 'rb')
response = s3.put_object(Body=f, Bucket=bucket,  Key='my.csv', ContentEncoding='gzip')

文件属性元数据 s3 python

codeAB

0 关注 0 粉丝 0 动态

关注关注

linux目录结构和文件属性管理

FHS定义了系统中每个区域的用途、所需要的最小构成的文件和目录，同时还给出了例外处理与矛盾处理。第二层则是针对/usr及/var这两个目录的子目录来定义。

hickwu 2020-06-16

Linux 下防止文件被误删除

chattr 命令简介这里我们需要使用到一个命令是：chattr ，这个命令在大部分的 Linux 发行版里都有，所以对于它的安装就不赘述了。它的基本用法如下：$ chattr 操作符属性文件名对于操作符，有以下三种：。$ man chattr防止

Ongoingcre 2020-06-09

Linux——文件属性详解

Linux文件或目录的属性主要包括：文件或目录的节点、种类、权限模式、链接数量、所归属的用户和用户组、最近访问或修改的时间等内容。inode译成中文就是索引节点。而inode呢，就是用来存储这些数据的信息，这些信息包括文件大小、属主、归属的用户组、读写权限

wintelx 2020-05-11

linux文件属性

如何查看文件详细信息?34332866 drwxr-xr-x 3 root root 20 Apr 30 15:01 oldboy1. 30050 -rw-r--r-- 1 root root 0 Apr 30 15:01 test1.txt. 3005

gdb 2020-05-01

LINUX文件类型（二）

通常还是以适当的扩展名来表示该文件的类型。.sh 批处理文件，批处理文件由shell写成。.z /.tar /.tar.gz /.zip /.tgz：打包的压缩文件。通常，LINUX上面的文件名只是用于了解文件的用途，执行是否依据属性规范。

atb 2020-04-18

Linux 文件|目录属性

第一个字符指定类型，-是文件，d是目录。后面9个字符是该文件|目录的用户权限：r读，w写，x执行。每3个一组，前三个是属主权限，中间三个是属组权限，后三个是其他组的用户的权限。2列名称是该文件|目录的属主、属组。chmod 761 文件名 r是4，w

cuixingwudi 2020-02-21

寒假13

1 持久化类Pojo 持久化类有一个属性ID，用来标识类的每个对象。xml配置文件主要用于配置数据库连接和Hibernate运行时所需的各种属性

DAV数据库 2020-02-14

Linux：文件属性信息-软硬链接数（ln）

在一个分区中,inode号码相同的文件,互为硬链接。-rw-r--r--. 2 root root 13 Apr 16 10:49 oldboy.txt

fenxinzi 2020-01-11

SpringMVC第二天

　　　　使用注解@DateTimeFormat:时间类型的类型转换器,指定pattern属性值，可以放在参数上或者bean类中的属性名上。　　　　File directory = new File;　　　　FileOutputStream fos = ne

smalllove 2019-12-24

文件属性、正则表达式、文件权限

39 -rw-r--r--. 2 root root 352 Nov 19 2018 /etc/hosts. inode号码是家庭地址，inode空间是家庭，文件名不存放在inode中。④inode节点号码相同，互为硬链接文件。用来实际存放数据的。②创建

qidu 2019-12-16

13-Linux核心知识-文件属性-中部

第一列后9个字符表示linux权限9位（12位）基础权限分三组：-rw- r-- r-- 1 yuyu yoyo exam本人家人物品。用户权限：文件对应的用户，对该文件的权限，看前3位用

secondid 2019-12-05

Linux常用命令

为了系统文件安全考虑，设置文件的只读属性非常有必要，而在linux CentOs 系统中设置文件的只读属性也非常的简单

嵌入式天地 2014-03-25

Linux 基础命令

rm选项与参数：-f ：就是 force 的意思，忽略不存在的文件，不会出现警告讯息；-i ：互动模式，在删除前会询问使用者是否动作-r ：递归删除啊！mv选项与参数：-f ：force 强制的意思，如果目标文件已经存在，不会询问而直接覆盖；-i ：若目标

hazing 2014-03-18

linux下查看一个文件的属性（ls，lsattr，file，stat）

查看文件属性有多种方法，且这些方法中偏向不同，具体如下：1,ls ls -a 查看所有文件 ls -l 查看详细的属性 2,lsattr 查看文件的扩展属性, 如果文件被　chattr +i 添加了写保护, 用lsattr可以看到添加的属性3,fi

zyccsdn 2015-07-27

spring注解：@Value在使用中遇到的问题

最近试着搭了一个spring+springmvc+mybatis+activiti的框架，遇到了不少问题。自己也学习了很多资料。在此记录下关于@Value使用过程中的一些问题。关于spring中@Value的使用，我主要是用来便捷地引用属性文件的键值。使用

怪盗基德 2017-09-22

IT兄弟连 HTML5教程 CSS3揭秘在HTML文档中放置CSS的几种方式

有很多方法将样式表加入到HTML中，每种方法都有自己的优点和缺点。新的HTML元素和属性已被加入，以允许样式表与HTML文档更简易地组合起来。将样式表加入到HTML中的常用方法有内联样式表、嵌入一张样式表或链接到一张外部的样式表。样式可以使用style属性

lcyangcss 2019-10-25

Java jdom解析xml文件带冒号的属性

如果xml文件解析带了冒号的属性，一般都是要特别处理，这里是命名空间，N年前遇到过一次忘记记录，后来也忘了，这次再记录下。解决了，记录下，分享给大家，百度到的都是没有任何用的，这里需要解析的是属性。DOM4J 可以用，但是便于项目的轻量级，纠结了后，这次使

Geeny 2019-09-08

一步一步学Linux C：文件类型和属性

Will0 2012-03-21

linux命令之文件属性详解详细解释

Linux文件或目录的属性主要包括：文件或目录的节点、种类、权限模式、链接数量、所归属的用户和用户组、最近访问或修改的时间等内容。而inode呢，就是用来存储这些数据的信息，这些信息包括文件大小、属主、归属的用户组、读写权限等。操作系统根据指令，能通过in

执迷不悔 2014-10-17

Win10怎么查看文件属性？Win10查看文件属性的快捷方法

有时候我们频繁需要查看文件属性，如果一个个右键点击来查看是不是很没效率呢?下面小编就给大家带来Win10查看文件属性的快捷方法，一起来看看吧。Alt+Enter键，Enter就是回车键，选中文件后按下这个组合键就可以快速打开文件属性界面。按住Alt然后用鼠

Jiminull 2017-01-03

安科网

Python 设置S3文件属性中元数据的Content-Encoding值

codeAB

codeAB

相关推荐

linux目录结构和文件属性管理

Linux 下防止文件被误删除

Linux——文件属性详解

linux文件属性

LINUX文件类型（二）

Linux 文件|目录属性

寒假13

Linux：文件属性信息-软硬链接数（ln）

SpringMVC第二天

文件属性、正则表达式、文件权限

13-Linux核心知识-文件属性-中部

Linux常用命令

Linux 基础命令

linux下查看一个文件的属性（ls，lsattr，file，stat）

spring注解：@Value在使用中遇到的问题

IT兄弟连 HTML5教程 CSS3揭秘在HTML文档中放置CSS的几种方式

Java jdom解析xml文件带冒号的属性

一步一步学Linux C：文件类型和属性

linux命令之文件属性详解详细解释

Win10怎么查看文件属性？Win10查看文件属性的快捷方法

codeAB