亚洲国产精品无码久久青草多少集|亚洲卡通av动漫公交车|五月婷婷综合资源在线观看|日韩免费性爱视频观看

【軟件新】WordStat 2022 新功能新特性

wordstat 2022 版有哪些新功能?我們很高興推出 wordstat 2022。從 wordstat 9 到新版本 wordstat 2022(以及新版本號方案)意味著快地引入每年發(fā)布一次的新功能,而不是每 2 或 3 年發(fā)布一次,并且很可能甚至每年不止一次。
新的 wordstat 2022 實(shí)現(xiàn)了幾個重要的功能,雖然沒有以前的主要版本那么多,但我們認(rèn)為它們具有重要意義,特別是對于開發(fā)分類模型、分類法或詞典。
1. 高度優(yōu)化的主題建模與因素分析在 wordstat 2022 中,我們實(shí)施了一個新的多線程因素分析例程,比以前的版本快 65 倍。這意味著現(xiàn)在可以在不到一分鐘的時間內(nèi)解決需要一個小時計(jì)算的大型問題。我們還能夠?qū)⒁蛩胤治鋈萘吭黾拥?10,000 個單詞(之前版本為 3,000 個)。
我們自己的研究工作表明,與依賴 lda 和神經(jīng)網(wǎng)絡(luò)技術(shù)的主題建模技術(shù)相比,使用因子分析的主題建模產(chǎn)生的主題解決方案加連貫和多樣化(peladeau & davoodi,2018 年;peladeau,2022 年)。它還具有穩(wěn)定性的額外好處,每次都會產(chǎn)生相同的結(jié)果。然而,它的主要不便一直是它的速度和容量。這使我們在 wordstat 8 中實(shí)現(xiàn)了一個使用非負(fù)矩陣分解(或 nmf)的特殊主題提取例程。這種技術(shù)可以地產(chǎn)生結(jié)果,這些結(jié)果與使用因子分析獲得的結(jié)果非常相似。然而,它的概率實(shí)現(xiàn)會導(dǎo)致每次運(yùn)行的結(jié)果略有不同,這讓一些研究人員感到有些不安。重要的是要注意,計(jì)算機(jī)科學(xué)中幾乎所有其他流行的主題建模技術(shù)產(chǎn)生的主題解決方案甚至比我們自定義的 nmf 實(shí)現(xiàn)不穩(wěn)定。那些尋求佳和穩(wěn)定的主題解決方案的人可能會喜歡新的因素分析主題建模例程的速度和容量大大提高。
2.改進(jìn)了頻率頁面上的建議wordstat 早期版本中的“建議”面板顯示同義詞庫可用的語言的同義詞、反義詞和相關(guān)詞。它還提供了以相同首字母開頭的單詞,使人們能夠識別一些拼寫錯誤以及相關(guān)的單詞。一個新的關(guān)聯(lián)詞部分現(xiàn)在從文本語料庫中檢索與頻率表中所選詞在語義、句法和統(tǒng)計(jì)上相關(guān)的其他詞。這個新功能應(yīng)該適用于任何語言。默認(rèn)情況下,條目將按相關(guān)性降序排列。同義詞、反義詞和相關(guān)詞也會按照相關(guān)性降序排列,便于識別合適的建議。人們?nèi)匀荒軌虬醋帜疙樞蚧蝾l率降序?qū)@些條目進(jìn)行排序。此外,一個新的頻率過濾選項(xiàng)可以讓人們過濾掉低頻建議,讓人們專注于頻繁的建議。
由于這種提取相關(guān)詞和排序建議的新方法與語言無關(guān),因此對于分析沒有詞庫的語言的人來說尤其有用。然而,我們發(fā)現(xiàn),即使有這樣的語言資源,基于單詞上下文使用的額外建議,以及根據(jù)相關(guān)性對現(xiàn)有同義詞和相關(guān)單詞進(jìn)行排序,也應(yīng)該較大地促進(jìn)適當(dāng)項(xiàng)目的識別。
3. 短語提取例程的新建議選項(xiàng)卡。重疊面板已替換為建議面板,除了重疊短語外,還顯示與短語頻率表中所選行在語義、句法或統(tǒng)計(jì)上相關(guān)的短語。此功能也與語言無關(guān)。
4. 命名實(shí)體識別的改進(jìn)。命名實(shí)體識別頁面中添加了一個新的相關(guān)面板。選擇單個命名實(shí)體將帶來相關(guān)的命名實(shí)體,以及屬于同一類(人、地點(diǎn)、組織等)的命名實(shí)體。選擇一個特定類別的多個示例(例如,多個城市)也將檢索屬于該類別的多項(xiàng)目。上下文菜單還允許將任何項(xiàng)目移動到分類詞典或排除列表中。還可以對選定的建議執(zhí)行上下文中的關(guān)鍵字搜索。
5. 上下文關(guān)鍵詞表中上下文詞的**顯示。在評估分類詞典中的詞或候選詞時,通常需要查看在目標(biāo)詞或短語出現(xiàn)的上下文中是否存在其他關(guān)鍵字。一種新的**顯示功能允許人們*要在單詞的周圍上下文中查找的單詞和短語列表。當(dāng)從主題建?;驑錉顖D中調(diào)用 kwic 列表時,或者在評估包含多個條目的內(nèi)容類別中的項(xiàng)目時,會自動填充此列表。
6.根據(jù)頻率或距原點(diǎn)的距離過濾對應(yīng)圖中的項(xiàng)目。過幾百個項(xiàng)目的對應(yīng)圖可能會在圖的中心(原點(diǎn))創(chuàng)建一大堆重疊的項(xiàng)目。添加了一個新的滑塊控件以隱藏不太頻繁或接近此原點(diǎn)的項(xiàng)目。除非有人想確定一個自變量的所有類的共同點(diǎn),否則有趣的項(xiàng)目是那些遠(yuǎn)離原點(diǎn)的項(xiàng)目,因?yàn)樗鼈兪遣煌惖奶卣?。過濾掉這些項(xiàng)目可以讓人們?nèi)菀椎刈R別不同的項(xiàng)目。
7.改進(jìn)關(guān)鍵字檢索關(guān)鍵字搜索的結(jié)果現(xiàn)在按相關(guān)性降序排列,同時考慮匹配項(xiàng)的頻率和種類與檢索到的文本段的長度的關(guān)系。新的頻率列也可用于僅按頻率排序。
8. 通過連接計(jì)算字符串變量一種新的數(shù)據(jù)轉(zhuǎn)換命令允許人們通過連接幾個現(xiàn)有變量(數(shù)字、字符串、日期等)的值以及鍵入的文本來計(jì)算字符串變量。這樣的過程也可用于用常量字符串值初始化字符串變量。
9.持久對比圖設(shè)置這些比較圖表的圖表類型和統(tǒng)計(jì)數(shù)據(jù)以及調(diào)色板現(xiàn)在鏈接到變量名稱并存儲在項(xiàng)目設(shè)置中。這些選項(xiàng)應(yīng)該跨頁面(頻率、短語、主題建模、樹狀圖等)和會話之間保持不變,從而減少不斷重新調(diào)整這些選項(xiàng)的需要。
軟件鏈接:
//www.uone-/wordstat.html
北京友萬信息科技有限公司專注于minitab,stata,spss等, 歡迎致電 18600528290

樂泰loctite3342結(jié)構(gòu)膠 耐高溫抗沖擊防潮磁鋼粘接

牛排包裝機(jī)型號-山東康瑞達(dá)-牛排包裝機(jī)

滁州*氣體*-聲譽(yù)良好-合肥圣辰

乘客電梯-太原乘客電梯價(jià)格-太原合興永達(dá)電梯(推薦商家)

南京石塑地板-石塑地板廠商-凱玥建材(推薦商家)

DL-SWS6手持式生物毒性檢測儀

大廈人臉識別一體機(jī)生產(chǎn)廠家-華瑞電子質(zhì)量過硬

包裝箱數(shù)控鋸-包裝箱數(shù)控鋸價(jià)格-安泰明佳數(shù)控(誠信商家)

高速噴射點(diǎn)膠機(jī)定制廠家-鑫華-變壓器粘接灌封高速噴射點(diǎn)膠機(jī)

宜春安全體驗(yàn)館-合肥佳新源|效果逼真-vr建筑安全體驗(yàn)館