数据仓库与ETL的实现过程.doc
上传人:yy****24 上传时间:2024-09-10 格式:DOC 页数:34 大小:1.4MB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

数据仓库与ETL的实现过程.doc

数据仓库与ETL的实现过程.doc

预览

免费试读已结束,剩余 24 页请下载文档后查看

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据仓库与ETL的实现过程一、抽取维度表(一)抽取维度表DimEmp依次打开Satrt|Allprogram|MicrosoftSQLServer2008|MicrosoftSQLServer®BusinessIntelligenceDevelopmentStudio。依次打开File|New|Project,在打开的对话框中选择IntegrationServicesProject,命名为ToDW,保存位置为C:\DocumentsandSettings\Administrator\Desktop\课程\练习\第2课,然后点击OK。在SolutionExplorer中选中SSISPackages,单击右键选择新建SSIS包。选中新建的包,右键单击选择rename,然后输入Dim.dtsx。点击空白处显示如下提示框,点击Yes。双击新建的SSIS包,即Dim.dtsx。在左侧Toolbox面板中将ExecuteSQLTask拖到ControlFlow中,再双击打开,如下图:在General中的Name后输入:truncatetableEMPProduct。点击选中Connection然后点击向下的箭头,选择NewConnection出现如下对话框:在该对话框中选择New出现下图:○在Servername中输入Localhost○Logontotheserver中选择UseWindowsAuthentication○Connecttodatabase中选择Selectorenterordatabasename,在下拉菜单选择HealthDW。点击TestConnection,显示TestConnectionsucceeded对话框即:然后点击OK关闭此信息框。点击OK关闭ConnectionManger对话框。在Dataconnection中,选中LOCALHOST.HealthDW,然后点击OK关闭ConfigureOLEDBConnectionManager对话框。选中SQLStatement然后点击后面的省略号,在出现如下对话框:在对话框中输入以下语句:useHealthDWtruncatetableDimEmpdbcccheckident(DimEmp,reseed,1)truncatetableDimProductdbcccheckident(DimProduct,reseed,1)点击OK关闭EnterSQLQuery对话框。点击OK关闭ExcuteSQLTaskEditor对话框。在Toolbox面板中将DataFlowTask拖到ControlFlow窗体中,并拖动truncatetableEMPProduct下面的绿色箭头连接到DataFlowTask上。选中DataFlowTask后单击,将其重命名为DimEmp。双击DimEmp,然后在Toolbox面板中将ExcelSource拖到DataFlow窗体中。选中ExcelSource后单击,将其重命名为:店面——销售一组,并双击它出现如下图示:选择OLEDBconnectionmanager右边的New出现ExcelConnectionManager对话框,如下图所示:在Excelfilepath中点击Brower,浏览Excel数据源所在位置C:\DocumentsandSettings\Administrator\Desktop\课程\快速入门\第2课:数据仓库与ETL的实现过程\工程文件\ToDW\DataSource\Storesales.xlsx。出现如下图示:然后点击OK关闭ExcelConnectionManager对话框。在Dataaccessmode中选择SQLcommand;在SQLcommandtext中输入:selectdistinctEmployName,GroupNamefrom[sheet1$]whereEmployNameisnotnull,然后点击OK。在Toolbox面板中将DerivedColumn拖到DataFlow窗体中,选中DerivedColumn重命名为:DeptName。拖动店面——销售一组下面的绿色箭头到DeptName上。双击DeptName后,加入DeptName列,在expression中输入”店面”,然后点击OK。具体操作如下图所示:注意:加入店面销售二组、店面销售三组和其派生列操作步骤同上。在Toolbox中将OLEDBSource到DataFlow中,重命名为Pos。双击Pos出现下图:OLEDBconnectionmanager中选择New,出现configureOLEDBConnection