Internet

Deneyler: nedir? Ne için tarih, türleri ve ipuçları

İçindekiler:

Anonim

Testler günlük donanım analizimizin önemli bir parçasıdır, size CPU'lar, grafik kartları, depolama üniteleri gibi farklı bileşenler arasında bilimsel olarak karşılaştırılabilir bir ölçüm sunmamızı sağlar . Bugün, tarihine, türlerine, nasıl çalıştıklarına, neyi ölçtüklerine, en yaygın önlemlerin neler olduğuna bazı satırlar ayıracağız ve bunları nasıl gerçekleştireceğimiz ve hangilerine güvenmemiz gerektiğine dair bazı ipuçları vereceğiz.

Bugün PC veya mobil dünyada ölçüt olarak bildiğimiz, bu devrimin başlangıcından bu yana kontrollü bir ortamda karşılaştırılabilir verilere dayalı karar vermeyi sağlayan endüstriyel ortamdan miras alınan tekniklerdir.

Modern bilgi işlem dünyası bu teknikleri birçok farklı alanın hemen hemen hepsine uygular ve ev kullanıcıları da bunları sistemimizin performansı ve yetenekleri hakkında bilgi edinmenin güvenilir bir yolu olarak ve ayrıca yeni bilgisayar, cep telefonu, ekran kartı vb. satın alma gibi önemli kararlar almak .

Bugün PC kıyaslamalarının geçmişi, var olan kıyaslama türleri ve sistemimizin hangi bileşenlerinin sadece performans değil bu tür testler için daha uygun olduğu hakkında konuşacağız.

İçindekiler dizini

tarih

Kıyaslama veya ölçüm sistemi, bilimsel olarak karşılaştırılabilir ve doğrulanabilir ve var olduğu için bilgisayar dünyasıyla bir arada bulunan kontrollü bir ortam ve tanınabilir önlemler uygular. Kıyaslama, temel özünün bir kısmının kaybolduğu, yani üçüncü taraflarca denetlenebilir ve doğrulanabileceği noktaya kadar demokratikleştirilmiştir. Şimdi bunu performansın hızlı bir karşılaştırması olarak kullanıyoruz, ancak üçüncü tarafların gerçekliğinin izlenebilirliği kesinlikle büyük ölçüde kayboldu.

En klasik kıyaslama yöntemleri her zaman sistem CPU'sunun bilgi işlem kapasitesinden bahsetmiştir, ancak son zamanlarda farklı bileşenler arasında değişmiştir, çünkü bunlar bir bilgisayar içinde üstünlük ve önem kazanmıştır.

Halen uygulanmakta olan en klasik iki ölçü birimi Dhrystones ve Whetstones'dur. Her ikisi de, bir şekilde, bugün bildiğimiz tüm sentetik kriterlerin temeli haline geldi.

En eskisi Whetstones (Birleşik Krallık'ta, Birleşik Krallık devlet enerji şirketinin atomik enerji bölümünün bulunduğu bir yer) ve Dhrystone daha sonra ilk (ıslak ve kuru) adıyla oynamaya geldi.

Birincisi 70'lerde tasarlandı ve ikincisi 80'lerden ve her ikisi de birbirini takip eden yıllarda sahip olduğumuz karşılaştırmalı performansın temelini oluşturuyor. Bileme taşları, basitleştirerek, kayan nokta işlemlerinde, çok sayıda ondalıklı işlemlerde işlemcinin hesaplama gücüne ilişkin bir fikir sundu.

Dhrystone, ondalıkları olmayan temel talimatlara adanmış olduğundan, her ikisi de tamamen farklı ama tamamlayıcı iki yaklaşımdan bir işlemcinin performansının net bir resmini verdi. Bileme taşları ve Dhrystone, bugün çok daha sık kullandığımız iki kavram olan MIPS ve FLOP'a dönüştü.

Bu ölçümlerden sonra FLOP (Kayan Nokta Aritmetik - kayan nokta aritmetiği) gibi başkaları geldi, bu da günümüzde büyük ölçüde, günümüzde pek çok modern teknikte gelişmiş hesaplamanın temelini oluşturduğundan bir bilgisayarda olduğundan daha önemlidir. yapay zeka algoritmaları, tıbbi algoritmalar, hava tahmini, bulanık mantık, şifreleme vb.

LINPACK, 1980'lerde mühendis Jack Dongarra tarafından geliştirildi ve bugün her türlü sistemin kayan nokta hesaplama kapasitesini ölçmek için kullanılmaya devam ediyor. Şu anda mimari, CPU üreticisi vb. Tarafından optimize edilmiş versiyonlar var.

FLOPS, grafik kartları (kesinlikle tanıdık tek veya çift hassas sesler), işlemciler hakkındaki makalelerimizi doldurur ve işletim veya geliştirmedeki herhangi bir süper bilgisayar için güç gereksinimlerini ve donanım geliştirmeyi hesaplamanın temelidir.

FLOP bugün endüstrideki en gerekli performans ölçüm birimidir, ancak her zaman ilginç bir ölçüm ölçüsü olan MIPS (saniyede milyonlarca talimat) ile birleştirilmiştir, çünkü bize talimat sayısını verir Bir işlemcinin saniyede gerçekleştirebileceği ancak işlemcinin mimarisine (ARM, RISC, x86 vb.) Ve programlama diline diğer ölçüm birimlerinden daha fazla bağlı olan temel aritmetik.

Performans ilerledikçe çarpanlar oldu. Şimdi GIPS ve GFLOPS'ta ev CPU'larının performansını ölçüyoruz. Taban aynı, klasik aritmetik işlemler olarak kalır. Sisoft Sandra, bazı sentetik ölçütlerinde bize bu tür ölçümler sunmaya devam ediyor.

MIPS ayrıca klasik bir öğe olarak CPU'ya daha fazla düştü ve FLOP, işlemcilerimize veya hepimiz işlemcilerimize monte ettiğimiz GPU'lar gibi belirli görevlere çok yönelmiş eski işlemcilerin genel hesaplanması gibi diğer gelişmekte olan alanlara genişletildi özel genişletme kartlarımız.

Bu temel kavramlara zaman, modern bir bilgisayarda veya süper bilgisayarda bunlardan çok daha önemli olan yeni ölçü birimlerini ekliyor. Veri aktarımı, çok önemli hale gelen ve şu anda GİB'lerde (saniye başına giriş ve çıkış işlemleri) ve ayrıca MB / GB / TB depolama önlemleri gibi diğer biçimlerde geçen süreye kıyasla ölçülen bu önlemlerden biridir. bir noktadan diğerine geçiş (MBps - Saniyede Megabayt).

AS-SSD, sabit diskin performansını MBps veya GİB cinsinden ölçebilir.

Şu anda, transfer ölçüsünü farklı çarpanlarında, iki nokta arasındaki bilgi aktarımının hızını, gerçekte biraz daha fazla bilgi üretmemiz gerektiğinde yorumlamanın bir yolu olarak kullanıyoruz. Bu, bilgi aktarımı için kullanılan protokole bağlıdır.

Bunun açık bir örneği ve çok kullandığımız PCI Express arayüzündedir. Bu protokol altında, taşımak istediğimiz her 8 bitlik bilgi için (0 veya 1s) 10 bit bilgi üretmeliyiz, çünkü fazladan bilgi hata düzeltme, veri bütünlüğü vb. İçin gönderilen iletişimin kontrolü içindir.

Bu gerçek bilgi kaybını da tanıtan diğer iyi bilinen protokoller, bu makaleyi okumak için kullandığınız IP'dir ve 300MT / s bağlantınızı gerçekten 300mbps hızın hemen altında sunar.

Bu nedenle, aslında alıcıda işlenen bilgilere değil, arayüz tarafından gönderilen ham bilgilere atıfta bulunduğumuzda Gigatransfer veya aktarımı kullanırız. Bir 8GT / s PCI Express 3.0 veri yolu, noktalar arasında bağlı her bir hat için aslında 6.4GBps bilgi gönderiyor. PCI Express protokolünün ev ve profesyonel bilgisayarın tüm ana veriyollarına entegrasyonu ile aktarım çok önemli hale geldi.

Son zamanlarda, aynı zamanda, işlem gücünü modern hesaplamadaki diğer çok önemli faktörlerle ilişkilendirmenin bir yolu olarak birleştirmeye başladık; tüketim, iki sistemin performansı arasında karşılaştırmalı bir ölçek olarak sunulan bu önlemlerden biri oldu. Enerji verimliliği bugün proses gücünden çok veya daha önemlidir ve bu nedenle proses gücünü ölçümdeki elemanın watt tüketimine göre karşılaştıran ölçütleri görmek kolaydır.

Aslında, süper bilgisayarların büyük listelerinden biri, bilgisayarın tüm bilgi işlem düğümleri arasındaki brüt gücüne değil, tüm sistemin tükettiği watt veya enerjiye dayalı olarak bu gücün geliştirilmesine atıfta bulunur. Green500 listesi (watt başına FLOPS - watt başına FLOPS), tüketimin artık kendine saygılı bir kıyaslama için nasıl temel olduğunun açık bir örneğidir, ancak şüphesiz hepimiz bu faktörü bir koşullandırma faktörü olmayan TOP500 listesine yakından bakmaya devam ediyoruz.

Kıyaslama türleri

Daha fazla aile veya kıyaslama türü hakkında konuşabilsek de, az çok ileri düzey kullanıcılar olarak hepimize en yakın olanların en yaygın iki sınıfındaki listeyi basitleştireceğim.

Bir yandan, bize daha önce bahsettiğimiz önlemleri sunan sentetik ölçütler var. Sentetik kriterler, belirli bir platform ve mimariye yönelik az çok kararlı bir program koduyla kontrollü testler yapan programlardır. Bir veya daha fazla bileşenimizi entegre edebilen, ancak aynı testin veya testlerin her zaman, değişiklik yapılmadan gerçekleştirildiği çok spesifik testler yapan programlardır.

Görüntü oluşturma, CPU'nun modern bir sistemdeki performansını bilmek her zaman iyi bir yöntem olmuştur, çünkü zorlu bir görevdir. Cinebench R15 ayrıca birden fazla çekirdekli ve işlem iş parçacıklı sistemlerin performansını bildiğimiz biri GPU ve iki CPU için çeşitli testlere sahiptir.

Sürümler dışında herhangi bir değişikliğin olmadığı ve bu değişikliklerin düzgün bir şekilde belgelendiği, kullanıcının hangi sürümlerin birbiriyle karşılaştırılabileceğini bilmesi için kontrollü bir test ortamı sunar. Bu tür programlar, bilgisayarımızın farklı alt sistemlerini ayrı ayrı test edebilir, belirli bir test türü gerçekleştirmek için diğer kod parçaları veya belirli karşılaştırmalı testlerle veya bir, iki veya daha fazla sistem bileşeninin performansından etkilenebilecek kombine olabilir. Bir oyuna entegre edilen kıyaslama veya Cinebench, Sisoft Sandra, SuperPI, 3DMark,… gibi programlar sentetik kıyaslamaların açık örnekleridir.

Gerçek ölçütlerle karıştırmamamız gereken diğer sentetik ölçütler, gerçek programların yürütülmesini simüle eden veya gerçek programlarda eylem komut dosyaları yürütenlerdir, testte herhangi bir rastgelelik olmadığından sentetiktirler, PC Mark, gerçek bir ölçütle karıştırabileceğimiz sentetik kıyaslama programı.

Gerçek kriter çok farklı bir test yöntemidir çünkü performansını ölçmek için bir program kullanmanın rastgele olduğunu kabul eder. Oyuncular, bir oyunun kalite parametrelerini donanımımızın olanaklarına göre ayarladığımızda bu tür karşılaştırmalar veya performans testi yapmak için kullanılır.

Oynarken bir oyunun performansını ölçmek gerçek bir ölçüttür.

Oyunun verdiği FPS'yi açıp sürekli olarak istenen 60FPS'yi elde etmeye çalıştığınızda, gerçek bir kıyaslama yapıyorlar. Aynı şey başka herhangi bir program türü için de tahmin edilebilir ve bir geliştiriciyseniz, programınızın kodunu optimize ettiğinizde, kodunuzun hangi değişikliklerin olduğu veya programın yürütülme biçiminin de olduğu bir platformda gerçek karşılaştırma testleri yapıyorsunuz. kararlı veya değişken donanım.

Her iki kıyaslama türü de önemlidir, birincisi sistemimizi kontrollü bir ortamda diğerleriyle karşılaştırmamıza izin verir ve ikincisi iki önemli faktörün de eklendiği operasyonumuzu, yürütmedeki rastgele ve insan faktörünü optimize etmenin bir yoludur. Her iki faktör de test etmek istediğimiz bileşenin veya bileşenlerin performansı hakkında ek bir bakış açısı sunar.

Kıyaslama yapılırken dikkat edilecek noktalar

Bir ölçütün yararlı ve etkili olabilmesi için gerçekten önemli olan bazı faktörleri hesaba katmamız gerekir. Farklı platformlar ve mimariler arasında karşılaştırma yapmak önemli bir belirsizlik faktörü getirmektedir, bu nedenle iOS cep telefonlarını Windows x86 bilgisayarlarla karşılaştırma olanağı veren bu tür karşılaştırmalar, bir örnek vermek için, bunları sadece cımbızlarla almak zorundasınız. işletim sistemi çekirdeği, ancak işlemci mimarileri çok farklı. Bu tür kriterlerin geliştiricileri (örneğin, Geekbench), farklı versiyonları arasında zor kontrol edilebilen düzeltme faktörleri sunar.

Bu nedenle, karşılaştırmalı değerlendirmenin farklı donanımlar arasında karşılaştırılabilmesi için ilk anahtar , test ekosisteminin karşılaştırmalı değerlendirme platformu, işletim sistemi, sürücüler ve yazılım sürümüyle mümkün olduğunca benzer olmasıdır. AMD grafiklerini Nvidia grafiklerine karşı test edersek, grafik denetleyicisi gibi homojenleştirmeyi kontrol edemediğimiz unsurlar kesinlikle olacak, ancak geri kalanı mümkün olduğunca kararlı hale getirmeye çalışmalıyız. Bu durumda, donanım kartlarını da dahil edeceğiz, çünkü grafik kartlarını karşılaştırmak için, işiniz aynı işletim sistemini, aynı işlemciyi, aynı anıları ve tüm çalışma parametrelerini kullanmak, kalite, çözünürlük ve test parametreleri de dahil olmak üzere aynı tutmaktır. Test ekosistemimiz ne kadar kararlı olursa, sonuçlarımız o kadar güvenilir ve karşılaştırılabilir olacaktır.

İşlemcimin bir darboğaz olup olmadığını nasıl anlayabilirim?

Dikkate almamız gereken başka bir şey, kıyaslama testlerinin normalde test edeceğimiz donanım üzerinde bir stres faktörüne sahip olması ve bu donanımı normalde sistemin normal kullanımında meydana gelmeyecek durumlara maruz bırakmasıdır. Sabit diskimizden, grafik kartımızdan veya işlemcimizden aldığımız her kıyaslama, bunları donanım için tehlikeli olabilecek durumlara sunar, bu nedenle stres noktasının bir kırılma noktası haline gelmemesi veya birçok bileşenin, örneğin kullanım aralıkları dışındaki sıcaklıklarda performanslarını düşürdükleri koruma sistemlerine sahip oldukları için performans azaltma unsuru. Yeterli soğutma, testler arasındaki dinlenme süreleri, test edilen bileşenlerin doğru beslenmesi… testin sorunsuz çalışması için her şey ideal bir durumda olmalıdır.

Öte yandan, bu tür durumlardaki istikrarını görmek için sistemi strese maruz bırakmak için tam olarak bu tür kriterleri kullanıyoruz, sadece performansı bilmek değil, aynı zamanda sistem bu stresli durumlarda olması gerektiği gibi çalışırsa, sistem kararlı ve daha da fazlasıdır.

Sonuç

Bilgisayar donanımını profesyonel olarak test etmeye adanmışlarımız için, kıyaslama çalışan bir araçtır ve bu sayede kullanıcılar, bir sonraki bilgisayarımızın her bir alt sistemindeki performansını hassas bir şekilde karşılaştırmak veya bilmek için bilimsel ve doğrulanabilir bir yola sahiptir. endüstriyel seviyede kullanılan aletlerle karşılaştırılabilir.

Resimde gördüğünüz gibi bir test tablosu, test yöntemini tam olarak standartlaştırmayı amaçlamaktadır, böylece karşılaştırmalı kıyaslama mümkün olduğunca güvenilirdir ve sonuçları değiştiren varyasyonlar eklenirken test edilebilir.

Ancak, herhangi bir “laboratuvar” testi gibi, güvenilir olması için, bunun gerçekleştirilmesi için doğru koşulların ve daha da farklı sistemler arasında karşılaştırılabilmesi için daha doğru koşullar mevcut olmalıdır.

Bugün size bu tür programların tarihi, farklı türleri, nasıl çalıştığı ve onlardan nasıl güvenilir bilgi edinebileceği hakkında biraz bilgi verdik. Onlar yararlı, ama benim için akılda tutulması gereken sadece bir bilgi daha ve her zaman kullanacağımız gerçek programlarla her zaman kişisel deneyim ve aktif testlerin arkasına koyarım.

Bir kıyaslama, karar sürecimize minimum performans verisi koymak için iyidir, ancak bu kararları tanımlamamalı ve son ipucu olarak mimariler, işletim sistemleri vb. Arasındaki performansı karşılaştırabileceğini iddia eden sentetik kıyaslamalardan kaçınmalıdır.

Internet

Editörün Seçimi

Back to top button