免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5101 | 回复: 1
打印 上一主题 下一主题

数据库与图片完美解决方案 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-01-09 11:26 |只看该作者 |倒序浏览
数据库与图片完美解决方案
电商商品图品与数据库脏数据完美解决方案
Mr. Neo Chen (netkiller), 陈景峰(BG7NYT)


中国广东省深圳市龙华新区民治街道溪山美地
518131
+86 13113668890
+86 755 29812080
<netkiller@msn.com>

$Id: mysql-plugin.xml 587 2013-05-16 09:49:20Z netkiller $

版权 © 2011, 2012, 2013 http://netkiller.github.io

$Date: 2013-05-16 17:49:20 +0800 (Thu, 16 May 2013) $

摘要

你是是不是在开发中常常遇到,删除了数据库记录后,发现该记录对应的图片没有删除,或者删除了图片,数据库中仍有数据存在,你的网站脏数据(图片)成几何数增长,阅读下文这里为你提供了一个完美决方案。

原文出处:http://netkiller.github.io/journal/mysql-plugin.html

我的系列文档

Netkiller Architect 手札         Netkiller Developer 手札         Netkiller PHP 手札         Netkiller Python 手札         Netkiller Testing 手札         Netkiller Cryptography 手札
Netkiller Linux 手札         Netkiller CentOS 手札         Netkiller FreeBSD 手札         Netkiller Security 手札         Netkiller Version 手札         Netkiller Web 手札
Netkiller Monitoring 手札         Netkiller Storage 手札         Netkiller Mail 手札         Netkiller Shell 手札         Netkiller Network 手札         Netkiller Database 手札
Netkiller PostgreSQL 手札         Netkiller MySQL 手札         Netkiller NoSQL 手札         Netkiller LDAP 手札         Netkiller Cisco IOS 手札         Netkiller H3C 手札
Netkiller Multimedia 手札         Netkiller Docbook 手札         Netkiller 开源软件 手札                            

目录

1. 背景
2. 解决思路
3. 解决方案
4. plugin 的开发与使用
5. 在事务中使用该插件
6. 通过触发器调用图片处理函数

1. 背景

我以电商网站为例,一般的网站产品数据存放在数据库中,商品图片是上传到文件服务器,然后通过http服务器浏览商品图片。这是最基本的也是最常见做法。

稍复杂的方案是,如果图片数量庞大,会使用分布式文件系统方案。但是这些方案都不能保证数据的完整性,极易产生脏数据(垃圾数据)。脏数据是指当你删除了数据库表中的记录后,图片仍然存在,或者手工删除了图片,而数据库中的记录仍然存在。

将图片放入数据库中存放在BLOB的方法可以解决脏数据问题,典型的案例是公安的身份证系统。但这种方案的前提是,图片不能太大,数量不多,访问量不大。 这显然不适合电商网站。

2009年我在走秀网工作,商品图片与缩图文件900GB到2012离职已经有10TB,每天有成百上千的商品上架下架,很多商品下架后永远不会再上架,这些批量下架的商品数据不会删除,仅仅标记为删除,总是期望以后能继续使用,实际上再也不会有人过问,另一方面随着品类经理频繁更换,员工离职,这些商品会石沉大海,再也无人问均。这些商品所对应的图片也就脏数据主要来源。新的品类经理上任后,会重新拍照,上传新图片。

总之,删除数据库中的数据不能将图片删除就会产生脏数据。很多采用删除数据的时候去检查图片如果存在先删除图片,再删除数据的方法。这种方案也非完美解决方案,存在这图片先被删除,程序出错SQL没有运行,或者反之。
2. 解决思路

如果删除图片能够成为事物处理中的一个环节,所有问题都能迎刃而解,可彻底解决脏数据的烦恼。
3. 解决方案

mysql plugin 开发 udf。我写几个function

UDF

image_check(filename)

    检查图片是否存在.
image_remove(filename)

    删除图片.
image_rename(oldfile,newfile)

    更改图片文件名.
image_md5sum(filename)

    md5sum 主要用户图片是否被更改过.
image_move(filename,filename)

    移动图片的位置

有了上面的function后你就可以在begin,commit,rollback 直接穿插使用,实现在事物处理期间做你爱做的事。
4. plugin 的开发与使用

编译UDF你需要安装下面的软件包

sudo apt-get install pkg-config
sudo apt-get install libmysqlclient-dev

sudo apt-get install gcc gcc-c++ make automake autoconf
               

https://github.com/netkiller/mysql-image-plugin

编译udf,最后将so文件复制到 /usr/lib/mysql/plugin/

git clone https://github.com/netkiller/mysql-image-plugin.git
cd mysql-image-plugin/src

gcc -I/usr/include/mysql -I./ -fPIC -shared -o image.so image.c
sudo mv image.so /usr/lib/mysql/plugin/
               

装载

create function image_check returns boolean soname 'images.so';
create function image_remove returns boolean soname 'images.so';
create function image_rename returns boolean soname 'images.so';
create function image_md5sum returns string soname 'images.so';
create function image_move returns string soname 'images.so';
               

卸载

drop function image_check;
drop function image_remove;
drop function image_rename;
drop function image_md5sum;
drop function image_move;
               

5. 在事务中使用该插件

插入图片流程,上传图片后,通过插件检查图片是否正确上传,然后插入记录

begin;
IF image_check('/path/to/images.jpg') THEN
        insert into images(product_id,thumbnail,original) values(1000,'thumbnail/path/to/images.jpg','original/path/to/images.jpg');
        commit;
ELSE
        image_remove('/path/to/images.jpg');
END IF
rollback;
               

删除商品采用image_move 方案,当出现异常rollback后还可以还原被删除的图片

begin;
IF image_check('/path/to/images.jpg') THEN
        select thumbnail,original into @thumbnail,@original from images where id='1000' for delete;
        delete from images where id='1000';
        select image_move(@thumbnail,'recycle/path/to/');
        select image_move(@original,'recycle/path/to/');
        commit;
END IF

rollback;
select image_move('recycle/path/to/images.jpg','path/to/images.jpg');
               

我们可以使用EVENT定时删除回收站内的图片

image_remove('recycle/path/to/images.jpg');
               

6. 通过触发器调用图片处理函数

通过触发器更能保证数据完整性

1. insert 触发器的任务: 插入记录的时候通过image_check检查图片是否正常上传,如果非没有上传,数据插入失败。
2. delete 触发器的任务: 检查删除记录的时候,首先去删除图片,删除成功再删除该记录。
               

触发器进一步优化

1. insert 触发器的任务: 插入记录的时候通过image_check检查图片是否正常上传,如果非没有上传,数据插入失败。如果上传成功再做image_md5sum 进行校验100% 正确后插入记录
2. delete 触发器的任务: 检查删除记录的时候,首先去改图片文件名,然后删除该记录,最后删除图片,删除成功。如果中间环境失败 记录会rollback,图片会在次修改文件名改回来。100% 保险
               

论坛徽章:
4
双子座
日期:2014-08-28 10:08:002015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:112015年亚洲杯之阿联酋
日期:2015-03-13 03:25:15
2 [报告]
发表于 2014-01-16 12:32 |只看该作者
mysql的扩展学习了,但是其实格调有些小,首先几十T数据真的不算什么成本

其次mysql本来操作的时候可能有内存缓存什么的,加了这个扩展后会不会导致TPS下降,毕竟要操作一张图片

这个图片可能在本机或者在其他机器上。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP