發布日期:2021-10-21
一、項目基本情況
原公告的采購項目編號:ZF2021-06-0651
原公告的采購項目名稱:中國科學技術大學多語種語音語言數據庫采購
首次公告日期:2021年10月14日
二、更正信息
更正事項:采購文件
更正內容:
我公司現對中國科學技術大學多語種語音語言數據庫采購招標文件做出如下答疑澄清。此次答疑澄清作為招標文件的組成部分,具有同等效力。答疑澄清與招標文件不同之處,按本次答疑澄清內容執行。
項目答疑澄清內容如下:
標包1、2:
1. 分段內容是僅打點+標簽還是完成切音,交付切音后文件?
答復:交付的單條音頻格式是按照標注要求完成打點切分和標注的3分鐘音頻文件和對應標注結果的textgrid文本文件。
2. 特殊書寫方式有哪些?具體統一標準是我方提供標注詞典還是客戶提出統一要求?
答復:如有特殊書寫方式,由中標單位與我方溝通一致后,由中標單位提供標注詞典。
3.招標方的查重手段及重復判定標準是什么,比如兩句話如果按文字重復的話重疊比例多少才算重復?
答復:將文本的內容去除標點、標簽等字符后,用萊文斯坦距離得出重復率;重復率高于等于50%,視為重復。
4.驗收具體實施中的自檢報告是指什么?和第三方檢測機構的檢測報告是同一份報告么?
答復:自檢報告指的是中標單位自己針對驗收項進行的數據質檢結果,自檢報告和第三方檢測機構的檢測報告非同一份。
標包4:
1.平均每張圖每行清晰字符不少于 20 個字符—對于某些類別圖片很難達到,比如名片、菜單等(中文 OCR 一般平均一行文字很難超過 20 個字符);
答復:特殊場景除外,不做每行字符數要求。
2.所有場景圖片中,需覆蓋模糊(運動模糊,失焦模糊,拍攝對象本身模糊等)及光線問題(反光、暗光、亮光、亮暗交替等)圖片—是否可以理解為自然采集即可,無其他比例限制。
答復:涉及即可,沒有比例要求。
3.如一行文字中出現了幾種不同的語種選擇哪個類別?
答復:以占比最高的語種為主,如果比例五五開的語種,一行內按語種拆分,分別拉框標對應語種屬性。
4.如一行文字中出現了部分文字不是需求語種,如何標注?
答復:若占比較大則屬于other language,如占比較低,一行框,屬于需求語種。
5.圖片分辨率有沒有要求。
答復:沒有強行要求,內容可辨識即可。
6.標注屬性:語種信息、文字排版橫豎走向、涂抹、反光、模糊、公式,有無其他屬性?
答復:沒有反光屬性,反光情況文字可辨識為涂抹橫/豎屬性,不可辨識為模糊屬性,還有多點屬性和其他語種屬性。
7.采集場景是否有比例要求;
答復:無。
更正日期:2021年10月21日
三、其他補充事宜
無
四、凡對本次公告內容提出詢問,請按以下方式聯系。
1.采購人信息
名 稱:中國科學技術大學
地址:合肥市金寨路96號
聯系方式:郭武:0551-63607871
2.采購代理機構信息
名 稱:安徽省招標集團股份有限公司
地 址:合肥市包河大道236號
聯系方式:應急客服電話:0551-62220153(接聽時間:8:30-12:00,13:30-17:30,節假日除外。潛在投標人應優先撥打項目聯系人聯系電話,無人接聽時再撥打該“應急客服電話”)
3.項目聯系方式
項目聯系人:劉志凌、魏思宇、張文奇
電 話: 0551-62220268、62220264、15324494256