Golang实现异步上传文件支持进度条查询的方法
作者:aside section 发布时间:2024-05-08 10:13:17
标签:Golang,异步上传,进度条查询
业务背景
业务需求要求开发一个异步上传文件的接口,并支持上传进度的查询。
需求分析
ZIP压缩包中,包含一个csv文件和一个图片文件夹,要求:解析csv数据存入mongo,将图片文件夹中的图片信息对应上csv中的人员信息。
ZIP压缩包解压
使用golang自带的 "archive/zip" 包解压。
func decompressZip(filePath, dest string) (string, string, error) {
var csvName string
imageFolder := path.Base(filePath)
ext := path.Ext(filePath)
folderName := strings.TrimSuffix(imageFolder, ext)
src, err := os.Open(filePath)
if err != nil {
return "", "", err
}
defer src.Close()
zipFile, err := zip.OpenReader(src.Name())
if err != nil {
return "", "", err
}
defer zipFile.Close()
err = os.MkdirAll(path.Join(dest, folderName), os.ModePerm)
for _, innerFile := range zipFile.File {
info := innerFile.FileInfo()
if info.IsDir() {
continue
}
dst, err := os.Create(path.Join(dest, folderName, info.Name()))
if err != nil {
fmt.Println(err.Error())
continue
}
src, err := innerFile.Open()
if err != nil {
fmt.Println(err.Error())
continue
}
io.Copy(dst, src)
}
destPath, err := ioutil.ReadDir(path.Join(dest, folderName))
if err != nil {
return "", "", err
}
for _, v := range destPath {
if path.Ext(v.Name()) == ".csv" {
csvName = path.Join(dest, folderName, v.Name())
}
}
return folderName, csvName, nil
}
在这个解压的过程中,压缩包的树结构只能到2层
import.zip
┝┅┅import.csv
┖┅┅images
在解压后,所有的文件都会在同一个目录下,既images中的图片会变成和.csv文件同级
验证csv文件编码格式是否为UTF-8
func ValidUTF8(buf []byte) bool {
nBytes := 0
for i := 0; i < len(buf); i++ {
if nBytes == 0 {
if (buf[i] & 0x80) != 0 { //与操作之后不为0,说明首位为1
for (buf[i] & 0x80) != 0 {
buf[i] <<= 1 //左移一位
nBytes++ //记录字符共占几个字节
}
if nBytes < 2 || nBytes > 6 { //因为UTF8编码单字符最多不超过6个字节
return false
}
nBytes-- //减掉首字节的一个计数
}
} else { //处理多字节字符
if buf[i]&0xc0 != 0x80 { //判断多字节后面的字节是否是10开头
return false
}
nBytes--
}
}
return nBytes == 0
}
后续支持utf-8转码
这个utf8编码判断方法是网上down下来的,后续优化一下
主逻辑
type LineWrong struct {
LineNumber int64 `json:"line_number"`
Msg string `json:"msg"`
}
func Import(/*自定义参数*/){
// decompress zip file to destination address
folder, csvName, err := Decompress(path.Join(constant.FolderPrefix, req.FilePath), dest)
if err != nil {
fmt.Println(err.Error())
}
// check if the file encoding is utf8
b, err := ioutil.ReadFile(csvName)
if err != nil {
fmt.Println(err.Error())
}
if !utils.ValidUTF8(b) {
fmt.Println(errors.New("数据编码错误,请使用utf-8格式csv!"))
}
// create goroutine to analysis data into mongodb
var wg sync.WaitGroup
wg.Add(1)
// used to interrupt goroutine
resultChan := make(chan error)
// used to record wrong row in csv
lW := make(chan []LineWrong)
go func(ctx *gin.Context, Name, csvPath, dir, folder string) {
defer wg.Done()
tidT, ciT, lwT, err := importCsv(ctx, Name, csvPath, dir, folder)
resultChan <- err
if err != nil {
fmt.Println(err.Error())
}
lW <- lwT
if len(lwT) == 0 {
importClassData(ctx, tidT, ciT)
}
}(ctx, req.Name, csvName, dest, folder)
err = <-resultChan
lineWrong := <-lW
close(lW)
···
}
// pre-analysis data in csv and through wrong data with line numbers and information
func importCsv()(){
···
}
// analysis data again and save data into mongodb, if is there any error,through them same as import()
func importClassData()(){
···
conn, err := connect()
if err != nil {
return err
}
defer conn.Close()
conn.Do("hset", taskId, "task_id", (curLine*100)/totalLines)
···
}
将错误信息以channel接收,使用 package "sync" 的 sync.WaitGroup 控制异步协程。在入库的过程中,将当前的进度存入redis。
查询进度接口
func QueryImport()(){
conn, err := connect()
if err != nil {
return nil, err
}
defer conn.Close()
progress, _ := conn.Do("hget", key, field)
if pro, ok := progress.([]uint8); ok {
ba := []byte{}
for _, b := range pro {
ba = append(ba, byte(b))
}
progress,_ = strconv.Atoi(string(ba))
}
return progress
}
从redis中取出来的数据是[]uint8类型数据,先断言,然后转类型返回。
来源:https://studygolang.com/articles/24191


猜你喜欢
- vue切换“页面”(路由)时保持滚动条回到顶部vue项目做pc端的时候,发现在两个页面切换时 滚动条
- 当项目里用npm安装了babel-cli之类的包时,webstorm在索引node_modules文件时,会卡死接近这个问题的办法是把nod
- 编辑注:在Review别人的JavaScript代码时曾看到过类似的队列函数,不太理解,原来这个是为了保证函数按顺序调用。读了这篇文章之后,
- 上一篇中的方法在 webpack 更新后,uglify 缓存地址也发生了变化,需要重新找地址。后来测试发现不论是 uglify-js2 ug
- 今早开机发现,打开SQL Server 2008 的 SQL Server Management Studio,输入sa的密码发现,无法登陆
- 想用linux虚拟机装一个oracle,中间遇到的坑太多了,最后总算是安装好了,一定要写个全面的教程出来。话不多说通用编辑命令:vi tes
- 一、简介本章内容主要通过具体的简单示例来分析Vue3是如何实现响应式的。理解本章需要了解Vue3的响应式对象。只注重原理设计层面,细节不做太
- 前文: 之前一直用Elemet-UI的upload组件,但是ui给出的样式Element-UI满足不了,所以决定自己写一个玩玩总体分三步:1
- 本文介绍了Python3安装Scrapy的方法步骤,分享给大家,具体如下:运行平台:WindowsPython版本:Python3.xIDE
- 之前,我曾转过一个单元测试框架系列的文章,里面介绍了 unittest、nose/nose2 与 pytest 这三个最受人欢迎的 Pyth
- 本文实例讲述了Python只用40行代码编写的计算器。分享给大家供大家参考,具体如下:效果图:代码:from tkinter import
- Python 绘制箱线图主要用 matplotlib 库里 pyplot 模块里的 boxplot() 函数。plt.boxplot() 参
- 介绍:细处着手,巧处用功。高手和菜鸟之间的差别就是:高手什么都知道,菜鸟知道一些。电脑小技巧收集最新奇招高招,让你轻松踏上高手之路。摘要:
- 简介概念散列算法(Hash Algorithm),又称哈希算法,杂凑算法,是一种从任意文件中创造小的数字「指纹」的方法。与指纹一样,散列算法
- 直观感受几种常用排序算法,具体内容如下1 快速排序介绍:快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n
- by leecade :我聊下我的想法 从功能上看,能不能把JS分成3层结构1 语法设计,选择器,常用函数2 业务逻辑(比如封装好常用的TA
- 我们主要讲解一下利用Python实现感知机算法。算法一首选,我们利用Python,按照上一节介绍的感知机算法基本思想,实现感知算法的原始形式
- 1. 打开Anaconda Prompt(在命令行格式下,输入代码,建立pytorch环境、安装pytorch、测试pytorch过程)2.
- 有时候需要罗列下U盘等移动设备或一个程序下面的目录结构的需求。基于这样的需求个人整理了一个使用Python的小工具,期望对有这方面需求的朋友
- 本文分析了mysqld进程关闭的过程,以及如何安全、缓和地关闭MySQL实例,对这个过程不甚清楚的同学可以参考下。关闭过程:1、发起shut