PTT評價

[請益] excel轉資料庫(大量計算)

看板Soft_Job標題[請益] excel轉資料庫(大量計算)作者
scalawax
(aliang)
時間推噓19 推:19 噓:0 →:19

各位大大您們好,

我正在做實價登錄的分析,因為實價登錄的資料有點亂,所以我寫了一堆算式去算,但是一個檔案都太大(至少150-180MB),所以每次更新都要跑一整個晚上,重點是還不知道是否有跑完(三不五時會發現計算錯誤)。。。。

想改到資料庫或其他的架構,是不是真的會比較快?但是重點是有辦法處理大量的計算。。。。

真的不知道該用什麼。。。

我不是唸相關科系的,實在不知道該從哪裡下手。。。。

想聽聽大家專業意見,不管是ACCESS或是python或是有其他大家覺得更好的方式 ,有一個方向我再去好好鑽研。。。

麻煩大家幫我指點明燈~~~ 跪恩!

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.201.197 (臺灣)
PTT 網址

airtsubasa06/22 16:30換電腦

gnseed06/22 16:34演算法寫得不好吧...連G都沒出現的資料不能稱為大

final0106/22 16:37excel?? 那個不是很慢

ntpuisbest06/22 16:37用r data table 寫的非常快

kokolotl06/22 16:51excel函數一大就算到死了 改用R或python都舒服很多

Virness06/22 17:04mysql mongo都可以我之前也是excel超痛苦

MOONY13506/22 17:05看你的檔案類型啊 是一天一個檔案還是一個檔案會慢慢變

MOONY13506/22 17:06大 後者的話直接建議塞進db 前者大概就是換語言讀寫

azzc103106/22 19:43python去讀 再去下你要看的函數

lazarus112106/22 20:04把function換成vba來跑會快不少

lazarus112106/22 20:10之前資料量大用excel都盡量不寫函數,不然下拉時容

lazarus112106/22 20:10量跟耗的效能都會等比成長

tedmax10006/22 21:04不動產業的RD??

DrTech06/22 21:57才不到200M,用程式讀到記憶體算,就解決了。根本不用資料

DrTech06/22 21:57庫。

yyc121706/22 23:24要不要試試看Google colab

qazxws06/23 00:13Apache Spark

new12285106/23 00:32Hadoop

marc4706/23 01:41julia

marc4706/23 01:44https://bit.ly/3jgMzfB

marc4706/23 01:50https://bit.ly/2SWriN9

KeyFSN06/23 12:42才 180 MB 根本不用什麼 spark 啦 XD

KeyFSN06/23 12:43直接 python 全讀到 memory 然後算一算就結了

sammythekid06/23 14:57樓上講完了

wahaha27906/24 00:19用aws elk做資料搜尋

adsl1236706/24 15:50DB用哪一個?

scalawax06/24 18:30哈哈哈哈,謝謝大家的幫忙,但大家的回覆我真的看不懂,

scalawax06/24 18:30大家實在是太專業了。。。。我是在一家建商,老闆常叫

scalawax06/24 18:30我做市調,所以自己弄了套excel+power BI,看來得來自

scalawax06/24 18:30學python了。。。。

alivetaxi06/24 20:28試試access 應該夠用了

divergience06/24 20:50VBA 就夠了

alice7822606/24 23:37excel和power bi有沒有裝64位元的,記憶體有沒有加到3

alice7822606/24 23:372G?32位元的軟體跑不動很正常。

jinmin8806/25 19:37c#的話我記得有excel lib支援yield return

acgotaku07/02 18:24Amazon Athena申請一個,資料丟進去 你會發現魔法