十年網(wǎng)站開發(fā)經(jīng)驗 + 多家企業(yè)客戶 + 靠譜的建站團隊
量身定制 + 運營維護+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
將文本文件導入Oracle中需要用sqlloader的方式。
創(chuàng)新互聯(lián)成立于2013年,先為曲沃等服務建站,曲沃等地企業(yè),進行企業(yè)商務咨詢服務。為曲沃企業(yè)網(wǎng)站制作PC+手機+微官網(wǎng)三網(wǎng)同步一站式服務解決您的所有建站問題。
1、在數(shù)據(jù)庫中創(chuàng)建相應的表。
如,文本文件內(nèi)容為:
1
2
3
4
create table test
(id int,
name varchar2(10),
sex varchar2(10));
2、在電腦中某路徑下編寫ctrl文件,以c盤data目錄為例,添加如下文本。如,被導入的文件名為load.txt
1
2
3
4
5
6
load data
infile 'load.txt' --被導入文件名
replace into table test
(id char terminated by ',',
name char terminated by ',',
sex char terminated by whitespace)
編寫后,將文件保存成load.ctrl
3、然后打開命令提示符,并進入到文本文件和ctrl文件所在目錄。
4、輸入以下語句,并執(zhí)行。
1
sqlldr userid=用戶名/密碼@數(shù)據(jù)庫實例名 control=load.ctl log=load.log
5、導入后,test表中數(shù)據(jù)如下:
前提:在做insert數(shù)據(jù)之前,如果是非生產(chǎn)環(huán)境,請將表的索引和約束去掉,待insert完成后再建索引和約束。
insert into tab1 select * from tab2; commit;
這是最基礎的insert語句,我們把tab2表中的數(shù)據(jù)insert到tab1表中。根據(jù)經(jīng)驗,千萬級的數(shù)據(jù)可在1小時內(nèi)完成。但是該方法產(chǎn)生的arch會非??欤枰P注歸檔的產(chǎn)生量,及時啟動備份軟件,避免arch目錄撐爆。
alter table tab1 nologging;
insert /*+ append */ into tab1 select * from tab2;
commit; alter table tab1 logging;
該方法會使得產(chǎn)生arch大大減少,并且在一定程度上提高時間,根據(jù)經(jīng)驗,千萬級的數(shù)據(jù)可在45分鐘內(nèi)完成。但是請注意,該方法適合單進程的串行方式,如果當有多個進程同時運行時,后發(fā)起的進程會有enqueue的等待。注意此方法千萬不能dataguard上用,不過要是在database已經(jīng)force logging那也是沒有問題的。
insert into tab1 select /*+ parallel */ * from tab2; commit;
對于select之后的語句是全表掃描的情況,我們可以加parallel的hint來提高其并發(fā),這里需要注意的是最大并發(fā)度受到初始化參數(shù)parallel_max_servers的限制,并發(fā)的進程可以通過v$px_session查看,或者ps -ef |grep ora_p查看。
alter session enable parallel dml;
insert /*+ parallel */ into tab1 select * from tab2; commit;
其他方法:
并發(fā)的insert,尚未比較和方法2哪個效率更高(偶估計是方法2快),有測試過的朋友歡迎補充。
insert into tab1 select * from tab2 partition (p1);
insert into tab1 select * from tab2 partition (p2);
insert into tab1 select * from tab2 partition (p3);
insert into tab1 select * from tab2 partition (p4);
對于分區(qū)表可以利用tab1進行多個進程的并發(fā)insert,分區(qū)越多,可以啟動的進程越多。我曾經(jīng)試過insert 2.6億行記錄的一個表,8個分區(qū),8個進程,如果用方法2,單個進程完成可能要40分鐘,但是由于是有8個分區(qū)8個進程,后發(fā)進程有enqueue,所以因此需要的時間為40分鐘×8;但是如果用方法5,雖然單個進程需要110分鐘,但是由于能夠并發(fā)進程執(zhí)行,所以總共需要的時間就約為110分鐘了。
DECLARE TYPE dtarray IS TABLE OF VARCHAR2(20)
INDEX BY BINARY_INTEGER;
v_col1 dtarray; v_col2 dtarray; v_col3 dtarray;
BEGIN SELECT col1, col2, col3 BULK COLLECT INTO v_col1, v_col2, v_col3
FROM tab2;
FORALL i IN 1 .. v_col1.COUNT insert into tab1
WHERE tab1.col1 = v_col1;
END;
用批量綁定(bulk binding)的方式。當循環(huán)執(zhí)行一個綁定變量的sql語句時候,在PL/SQL 和SQL引擎(engines)中,會發(fā)生大量的上下文切換(context switches)。使用bulk binding,能將數(shù)據(jù)批量的從plsql引擎?zhèn)鞯絪ql引擎,從而減少上下文切換過程,提升效率。該方法比較適合于在線處理,不必停機。
sqlplus -s user/pwd runlog.txt set copycommit 2;
set arraysize 5000;
copy from user/pwd@sid - to user/pwd@sid - insert tab1 using
select * from tab2; exit EOF
用copy的方法進行插入,注意此處insert沒有into關鍵字。該方法的好處是可以設置copycommit和arrarysize來一起控制commit的頻率,上面的方法是每10000行commit一次。
ALTER
DATABASE
MOUNT用來裝載數(shù)據(jù)庫,并啟動實例。如果是在日志文件中出現(xiàn),則表示啟動數(shù)據(jù)庫。
alter
database
open將數(shù)據(jù)庫從mount狀態(tài)切換到打開狀態(tài)。如果打開成功,就是說這個時候數(shù)據(jù)庫可以提供服務了。
我給你一些數(shù)據(jù)庫常用的導入導出命令吧:\x0d\x0a該命令在“開始菜單運行CMD”中執(zhí)行\(zhòng)x0d\x0a一、數(shù)據(jù)導出(exp.exe)\x0d\x0a1、將數(shù)據(jù)庫orcl完全導出,用戶名system,密碼accp,導出到d:\daochu.dmp文件中\(zhòng)x0d\x0aexp system/accp@orcl file=d:\daochu.dmp full=y\x0d\x0a\x0d\x0a2、將數(shù)據(jù)庫orcl中scott用戶的對象導出\x0d\x0aexp scott/accp@orcl file=d:\daochu.dmp owner=(scott)\x0d\x0a\x0d\x0a3、將數(shù)據(jù)庫orcl中的scott用戶的表emp、dept導出\x0d\x0aexp scott/accp@orcl file= d:\daochu.dmp tables=(emp,dept)\x0d\x0a\x0d\x0a4、將數(shù)據(jù)庫orcl中的表空間testSpace導出\x0d\x0aexp system/accp@orcl file=d:\daochu.dmp tablespaces=(testSpace)\x0d\x0a\x0d\x0a二、數(shù)據(jù)導入(imp.exe)\x0d\x0a1、將d:\daochu.dmp 中的數(shù)據(jù)導入 orcl數(shù)據(jù)庫中。\x0d\x0aimp system/accp@orcl file=d:\daochu.dmp full=y\x0d\x0a\x0d\x0a2、如果導入時,數(shù)據(jù)表已經(jīng)存在,將報錯,對該表不會進行導入;加上ignore=y即可,表示忽略現(xiàn)有表,在現(xiàn)有表上追加記錄。\x0d\x0aimp scott/accp@orcl file=d:\daochu.dmp full=y ignore=y\x0d\x0a\x0d\x0a3、將d:\daochu.dmp中的表emp導入\x0d\x0aimp scott/accp@orcl file=d:\daochu.dmp tables=(emp)